Иврит и не только
https://www.slovar.co.il/forum/

Корректность при обсуждении словарей
https://www.slovar.co.il/forum/viewtopic.php?f=13&t=2549
Страница 1 из 2

Автор:  Admin [ Ср мар 07, 2007 08:05 ]
Заголовок сообщения:  Корректность при обсуждении словарей

В последнее время к нам обратилось несколько человек с просьбой/предложением опубликовать составленные ими словари на нашем сайте. Опубликовать, не требуя за это никакого вознаграждения для себя. Также совпало, что и у нас самих возникли идеи создать несколько подобных словарей.
Понятно, что все эти словари не прошли редакторской правки Д-ра Баруха Подольского. Более того, некоторые из наших авторов не являются специалистами в области лингвистики, но зато прекрасно знают тематику, о которой пишут. Так что прошу всех проявить особый такт при обсуждении публикуемых материалов. Словари будут размещаться в разделе Тематические словари.

Автор:  Игорь [ Вс дек 05, 2010 00:53 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Было бы неплохо организовать опубликованные тематические словари в виде программки, которая добавляла бы словарь в файлы myglossary*.dic или в виде уже готовой пары файлов myglossary*.dic

Автор:  Michael72 [ Ср июн 29, 2011 01:49 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Создал несколько словарей в формате DICT. Всё выложил в свою папку на сервисе Windows Live. Надеюсь, что мой труд вызовет интерес и будет полезен.

п.№, Кодовое имя словаря, Заголовок
  1. Hebrew-Russian, Hebrew-Russian Dictionary
  2. hebrusar, Иврит-русский словарь: оружие
  3. hebrusat, Иврит-русский словарь: автотермины
  4. hebrusbd, Иврит-русский словарь: велословарь
  5. hebrusch, Иврит-русский словарь: христианство
  6. hebruscl, Иврит-русский словарь: ткани
  7. hebruscr, Иврит-русский словарь: Устав акционерного общества
  8. hebrusdi, Иврит-русский словарь по страхованию
  9. hebrusdr, Иврит-русский словарь: Земснаряд, гидронамыв
  10. hebrusec, Иврит-русский словарь: экономика
  11. hebrusel, Иврит-русский словарь: электроника
  12. hebrusha, Иврит-русский словарь: Дом - Устройство, строение, элементы
  13. hebrushb, Иврит-русский словарь: трисы, шторы, ковры, постель
  14. hebrushc, Иврит-русский словарь: личные вещи, косметика, украшения
  15. hebrushd, Иврит-русский словарь: головные уборы
  16. hebrushe, Иврит-русский словарь: Оборудование, приспособления
  17. hebrushf, Иврит-русский словарь: Мебель
  18. hebrushg, Иврит-русский словарь: Стили, типы, виды
  19. hebrushl, Иврит-русский словарь: Электрооборудование, освещение
  20. hebrushp, Иврит-русский словарь: Водопровод, сантехника
  21. hebrushs, Иврит-русский словарь: канцелярские принадлежности, книги
  22. hebrusht, Иврит-русский словарь: телефон, телевизор, компьютер
  23. hebrushu, Иврит-русский словарь: посуда для приёма и приготовления пищи
  24. hebrushw, Иврит-русский словарь: Одежда, обувь, белье
  25. hebrushy, Иврит-русский словарь: гидравлические системы
  26. hebrusld, Иврит-русский юридический словарь
  27. hebrusmt, Иврит-русский словарь: Эпикризы выписной и переводной - мед.
  28. hebrusob, Иврит-русский словарь: Нефтебаза
  29. hebrusod, Иврит-русский словарь: Нефтегазопереработка и нефтехимия
  30. hebrusph, Иврит-русский словарь: физиология
  31. hebruspl, Иврит-русский словарь: растения
  32. hebrusrm, Иврит-русский словарь: Ресторанное меню
  33. hebrussh, Иврит-русский словарь: корабли
  34. hebrusta, Иврит-русский словарь: военные термины
  35. hebruswe, Иврит-русский словарь: сварка
  36. lingvo_hebrew-russian, Hebrew-Russian Lingvo Dictionary
  37. lingvo_russian-hebrew, Russian-Hebrew Lingvo Dictionary
  38. rushebar, Русско-ивритский словарь: оружие
  39. rushebat, Русско-ивритский словарь: автотермины
  40. rushebbd, Русско-ивритский словарь: велословарь
  41. rushebch, Русско-ивритский словарь: христианство
  42. rushebcl, Русско-ивритский словарь: ткани
  43. rushebcr, Русско-ивритский словарь: Устав акционерного общества
  44. rushebdi, Русско-Ивритский словарь по страхованию
  45. rushebdr, Русско-ивритский словарь: Земснаряд, гидронамыв
  46. rushebec, Русско-ивритский словарь: экономика
  47. rushebel, Русско-ивритский словарь: электроника
  48. rushebha, Русско-ивритский словарь: Дом - Устройство, строение, элементы
  49. rushebhb, Русско-ивритский словарь: трисы, шторы, ковры, постель
  50. rushebhc, Русско-ивритский словарь: личные вещи, косметика, украшения
  51. rushebhd, Русско-ивритский словарь: головные уборы
  52. rushebhe, Русско-ивритский словарь: Оборудование, приспособления
  53. rushebhf, Русско-ивритский словарь: Мебель
  54. rushebhg, Русско-ивритский словарь: Стили, типы, виды
  55. rushebhl, Русско-ивритский словарь: Электрооборудование, освещение
  56. rushebhp, Русско-ивритский словарь: Водопровод, сантехника
  57. rushebhs, Русско-ивритский словарь: канцелярские принадлежности, книги
  58. rushebht, Русско-ивритский словарь: телефон, телевизор, компьютер
  59. rushebhu, Русско-ивритский словарь: посуда для приёма и приготовления пищи
  60. rushebhw, Русско-ивритский словарь: Одежда, обувь, белье
  61. rushebhy, Русско-ивритский словарь: гидравлические системы
  62. rushebld, Русско-ивритский юридический словарь
  63. rushebmt, Русско-ивритский словарь: Эпикризы выписной и переводной - мед.
  64. rushebob, Русско-ивритский словарь: Нефтебаза
  65. rushebod, Русско-ивритский словарь: Нефтегазопереработка и нефтехимия
  66. rushebph, Русско-ивритский словарь: физиология
  67. rushebpl, Русско-ивритский словарь: растения
  68. rushebrm, Русско-ивритский словарь: Ресторанное меню
  69. rushebsh, Русско-ивритский словарь: корабли
  70. rushebta, Русско-ивритский словарь: военные термины
  71. rushebwe, Русско-ивритский словарь: сварка
  72. russian-hebrew-2006-11-08_luna, Russian-Hebrew Dictionary
  73. Russian-Hebrew_Phrase_book, Русско-Иврит разговорник
  74. Russian-Hebrew, Russian-Hebrew Dictionary

Не нашёл для своего поста более подходящего места чем это, так как сообщение касается всех словарей, выложенных здесь. В вышеприведённом списке представленны DICT-словари, которые были получены путем конвертирования практически всех словарей, которые на данный момент я нашёл в данном разделе форума. В настоящее время интенсивно продолжаю конвертировать в данный формат тематические словари, которые пользователи выкладывают в других разделах форума. Планирую в будущем все материалы разместить на DICT-сервере dict://dictd.xdsl.by, словари которого в частности могут быть доступны через web-интерфейс на сайте Slavic dictionaries on-line. Но в связи с этим есть идея, а что если основателям этого ресурса поднять свой DICT-сервер? Словарями в формате DICT могут пользоваться не только пользователи ОС GNU/Linux, так как есть программы-клиенты для Windows, но для работы этих программ нужен Он-Лайн DICT-сервер. Надеюсь, что совсем скоро вышеприведённые словари появятся на DICT-сервере dict://dictd.xdsl.by и у заинтересовавшихся будет возможность оценить эффективность использования словарей в формате DICT. Итак, пользователям ОС Windows для этого понадобится DICT-клиент. Чтобы найти такую программу, можно посмотреть здесь. Мне удалось найти прямую ссылку на одну из перечисленных там программ такого рода — Magical Jellybean Dictionary 1.1
Если у кого-то будет особое желание конвертировать в формат DICT какой-либо ивритский словарь, охотно выполню. Лично меня интересуют словари, так или иначе касающиеся тем юриспруденции и медицины. Поэтому я был бы очень благодарен за прямые ссылки на такого рода словари.
Примечание. В процессе конвертации не анализировались обсуждения, которые пользователи ведут относительно данных словарей, так как это отняло бы очень много времени. Надеюсь, что авторы словарей уже проанализировали все высказанные замечания и сделали те исправления, которые посчитали нужным сделать. В свою очередь, мне пришлось подвергнуть обработке данные материалы. Надеюсь, что данная обработка улучшит использование этих словарей.

Автор:  vcohen [ Ср июн 29, 2011 09:55 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Респект! (Хотя я в эти словари пока не заглядывал.)

Автор:  Michael72 [ Вт авг 16, 2011 01:35 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Модули lingvo_hebrew-russian и lingvo_russian-hebrew удалил, дабы не было нарушения авторских прав.

Автор:  Michael72 [ Пн июл 02, 2012 11:55 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Состряпал Словарь Он-Лайн, который делает запросы на DICT-сервер dict://cheusov.mova.org (бывший dict://dictd.xdsl.by). В общем, надеюсь, что все словари, которые здесь выкладываются, в скором будущем будут доступны через этот Он-Лайн словарь. Интерфейс напоминает старый вид словаря Он-Лайн Д-ра Б. Подольского.

Автор:  Michael72 [ Пн мар 17, 2014 13:37 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Иврит-русско-ивритский Словарь Он-Лайн с функцией лемматизации
Основная масса словарей, выложенных здесь, доступна через этот словарь.
Темы, начиная с даты: Пт окт 04, 2013 пока ещё не обрабатывались.

Автор:  vcohen [ Вт мар 18, 2014 15:24 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Michael72 писал(а):
Иврит-русско-ивритский Словарь Он-Лайн с функцией лемматизации
Основная масса словарей, выложенных здесь, доступна через этот словарь.
Темы, начиная с даты: Пт окт 04, 2013 пока ещё не обрабатывались.

Что это??? Интерфейс от Ириса, а сам словарь откуда? Я запустил слово слон, получил 4 варианта:

בישוף
הגמון
פיל
רץ בשחמט

Первое - полагаю, что это так перевелось на иврит английское слово bishop, соответствующее шахматному слону. Второе - не могу сообразить, как сюда попало. Но в любом случае таким словарем пользоваться нельзя.

Автор:  Michael72 [ Вт мар 18, 2014 22:50 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

vcohen писал(а):
Michael72 писал(а):
Иврит-русско-ивритский Словарь Он-Лайн с функцией лемматизации
Основная масса словарей, выложенных здесь, доступна через этот словарь.
Темы, начиная с даты: Пт окт 04, 2013 пока ещё не обрабатывались.

Что это??? Интерфейс от Ириса, а сам словарь откуда? Я запустил слово слон, получил 4 варианта:

בישוף
הגמון
פיל
רץ בשחמט

Первое - полагаю, что это так перевелось на иврит английское слово bishop, соответствующее шахматному слону. Второе - не могу сообразить, как сюда попало. Но в любом случае таким словарем пользоваться нельзя.

Огромное спасибо за проявленный интерес, произведённое тестирование, а также за данную оценку.
Все словарные базы сейчас лежат на DICT-сервере dict.dvo.ru, частично также на dict.mova.org, а также планируется размещение на dict.bibleonline.ru. На ваш запрос для слова "слон" была найдена словарная статья в словаре с кодовым именем Russian-Hebrew. При создании данного словаря был использован материал из двух словарей в формате Sdict: russian-hebrew-2006-11-08_luna.dct, Russian-Hebrew.dct, взятые с сайта Сообщество бесплатных словарей Sdictionary. Как выяснилось в последствии, автором словарной базы Russian-Hebrew (в формате DSL) является: Анатолий Кайдалов. По вопросу качества данной словарной базы от него была получена оценка аналогичная вашей. Он пояснил, что данная словарная база была получена автоматическим переводом без ручного редактирования, и не рекомендовал её к использованию. Однако, сложно отказаться от использования данной словарной базы. Без неё на ваш запрос вообще не появилось бы никакой статьи. И так было бы для большей части запросов пользователя. Поэтому на данном этапе получается, что словарь выдаёт большие списки значений, из которых многие не впопад и обусловлены расплывчатостью английского языка. Если бы у меня получилось получить разрешение на конвертацию в формат DICT словарной базы ИРИС'а, то было бы конечно намного впечатлительнее. Был бы словарь, который выдавал словарные статьи ИРИС'а плюс те, которые пользователи опубликовали в данном разделе форума. Однако такое разрешение я не получил. Я плохо разбираюсь в вопросах авторского права и не знаю даже, будет ли нарушение авторских прав в том случае, если словарная база, защищенная копирайтом, конвертируется легальным пользователем в другой формат с целью обеспечить себе более удобное использование данной базы в личных целях без предоставления её другим. Поэтому я воздерживаюсь от какого-либо конвертирования этой словарной базы. Но ваше замечание ценное тем, что обнаруживается недостаток, который требует не только усовершенствование существующей словарной базы, но и исправление самой программной оболочки. У моего словаря есть одна особенность – определения берутся из различных словарных баз, при этом не видно из какой именно базы, что взято. Это вызвано тем, что словарных баз получилось очень много, любое слово может просто дублироваться несколько раз в разных словарных базах. При этом все словарные базы очень простые, тут нет ни особых комментариев, ни особых поясняющих примеров, просто перечисление возможных значений. Эти обстоятельства побудили выполнить словарь таким образом, что он объединяет полученные результаты из всех словарных баз в одну словарную статью, в которой присутствует список уникальных значений слова (без излишних повторов). Но теперь мне кажется, что это выглядит как недостаток. Лучше будет сделать как во всех других подобных словарях, чтобы было видно из какого словаря какая словарная статья взята. Но в любом случае мой DICT-клиент, который выполнен в виде WEB-интерфейса, не единственный способ использовать все полученные словарные базы в формате DICT. На данный момент в качестве наилучшего DICT-клиента для использования в ОС Windows рекомендую программу GoldenDict. Домашняя страничка разработчиков GoldenDict — goldendict.org

Автор:  vcohen [ Вт мар 18, 2014 23:13 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Michael72 писал(а):
словарь выдаёт большие списки значений, из которых многие не впопад и обусловлены расплывчатостью английского языка.

Не надо переваливать ответственность на английский язык, он не виноват. Они обусловлены наличием третьего языка как посредника, сам подход порочный.

Автор:  Michael72 [ Ср мар 19, 2014 16:24 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

vcohen писал(а):
Michael72 писал(а):
Иврит-русско-ивритский Словарь Он-Лайн с функцией лемматизации
Основная масса словарей, выложенных здесь, доступна через этот словарь.
Темы, начиная с даты: Пт окт 04, 2013 пока ещё не обрабатывались.

Что это??? Интерфейс от Ириса, а сам словарь откуда? Я запустил слово слон, получил 4 варианта:

בישוף
הגמון
פיל
רץ בשחמט

Первое - полагаю, что это так перевелось на иврит английское слово bishop, соответствующее шахматному слону. Второе - не могу сообразить, как сюда попало. Но в любом случае таким словарем пользоваться нельзя.

Ради интереса провел исследование, используя словарь Babylon. Вот какой результат выдаёт Babylon для слова "bishop":
Цитата:
Babylon English-Hebrew

bishop
(ש"ע) הגמון, בישוף; רץ (כלי בשחמט)

Да уж. Путаница полнейшая. Вы правы, такой подход порочен. Но всё равно может быть польза при изучении языка, если понимать, что в словаре ошибки и не брать данную словарную базу за авторитет. Тогда получается, что словарь в Babylon Russian - Hebrew тоже некорректен? Вот, какая словарная статья в нём для слова слон:

Цитата:
слон (m)
פיל {elephant}
עבה עור; גס; חסר רגש {pachyderm}
הגמון, בישוף; רץ (כלי בשחמט) {bishop}

Или всё таки всё правильно? В русском языке ведь говорят на шахматную фигуру "слон": "офицер". Тут не может быть аналогичная ситуация?

Автор:  vcohen [ Ср мар 19, 2014 20:08 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Там всё правильно. Неправильно становится тогда, когда идет перевод через третий язык. Тот факт, что английское слово bishop обозначает и епископа, и шахматного слона, а русское слово слон обозначает и шахматного слона, и животное, - не должен приводить к тому, что зоологический слон приравнивается к епископу.

Автор:  Michael72 [ Ср мар 19, 2014 20:21 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

vcohen писал(а):
Там всё правильно. Неправильно становится тогда, когда идет перевод через третий язык. Тот факт, что английское слово bishop обозначает и епископа, и шахматного слона, а русское слово слон обозначает и шахматного слона, и животное, - не должен приводить к тому, что зоологический слон приравнивается к епископу.

Я ещё раз постараюсь особо выделить то, что вызывает затруднение, на которое не получил ответа из вашего последнего ответа.

В словарной статье словаря Babylon Russian - Hebrew последняя строчка:
Цитата:
הגמון, בישוף; רץ (כלי בשחמט) {bishop}

Я так понимаю, что вся строчка целиком подразумевает понятие слон как "шахматная фигура". Среди прочего используется слово הגמון. Это ошибка или нет?

Автор:  vcohen [ Чт мар 20, 2014 00:42 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

По-моему, "вся строчка целиком подразумевает" не одно понятие, а несколько разных понятий, соответствующих одному слову bishop, и перевод на иврит для каждого из них.

Автор:  Michael72 [ Пт сен 19, 2014 07:30 ]
Заголовок сообщения:  Re: Корректность при обсуждении словарей

Сравнительно недавно, мною раннее упомянутый, GoldenDict стал поддерживать DICT-протокол, поэтому, установив только программную оболочку, у вас уже будут в распоряжении все словари, которые находятся в Он-Лайн режиме на DICT-сервере. Нужно только GoldenDict должным образом настроить на какой-нибудь DICT-сервер. Но самое первое, что надо – это нужная версия GoldenDict’а, которая поддерживает DICT-протокол. Проект очень интенсивно развивается, так что новые версии чуть ли не каждый день. Итак, каким образом обновиться до самой последней версии, я напишу в этом посте.

Инструкция по установке
Начиная с версии 1.5.0-RC-343-gceb04db, GoldenDict может работать в качестве DICT-клиента. Для того, чтобы обновиться до самой последней версии, установите сперва стартовый комплект GoldenDict'а 1.5.0-RC-394-g141703a. Затем скопируйте в каталог, куда вы установили программу, содержимое каталога GoldenDict из архива GoldenDict-1.5.0-RC-440-gbb87aa0_(QT_530).7z (необязательно).

Инструкция по настройке на DICT-сервер
В меню Правка - Словари - Источники (F3) во вкладке "Серверы DICT" щелкните на кнопке Добавить и создайте новую запись. В поле "Название" напечатайте "Все на DICT-bibleonline". Впечатайте в поле "Адрес": “dict://dict.bibleonline.ru” (без кавычек), поставьте "галочку" у опции Включено и щелкните на OK.
Примечание
Список DICT-серверов см. здесь.

По большому счёту настройка будет произведена. Напишите в поле поиска слово לספר, и в списке вариантов, что под строкой поиска, появятся варианты:
לספר בסוד
לספר סיפורים
По умолчанию GoldenDict использует стратегию prefix и это влияет на то, что будет появляться в этом списке. Весь список стратегий следующий:
Код:
exact      Match headwords exactly
prefix     Match prefixes
nprefix    Match prefixes (skip, count)
substring  Match substring occurring anywhere in a headword
suffix     Match suffixes
re         POSIX 1003.2 (modern) regular expressions
regexp     Old (basic) regular expressions
soundex    Match using SOUNDEX algorithm
lev        Match headwords within Levenshtein distance one
word       Match separate words within headwords
first      Match the first word within headwords
last       Match the last word within headwords

На мой взгляд самые интересные стратегии это word и lev. У GoldenDict есть уникальная способность использовать сразу несколько стратегий. Посмотрим, что изменится, если указать эти две стратегии. Для этого снова перейдём в настройки: Правка - Словари - Источники - Серверы DICT и в поле “Стратегии” введём “word,lev” (стратегии вводятся через запятую). После этого OK и проверяем:

Изображение

На скриншоте видно, что теперь выпадающий список заметно увеличился.
Стратегия lev выполняет функцию чем-то напоминающую лемматизацию. В данном примере стратегия word себя проявила не столь очевидно. Её суть можно выразить так: позволяет найти не только отдельные слова, но все словосочетания, где есть искомое слово. Но до настоящей функции лемматизации тут ещё далеко. Можете сравнить результат для этого же слова на моём Словаре Он-Лайн. Появится побольше свободного времени, постараюсь прикрутить к GoldenDict настоящий лемматизатор. Есть примерные идеи как это можно сделать.
Если вы пользуетесь веб-браузером Internet Explorer, то можно получать перевод слов простым наведением курсора. Для этого нужно в GoldenDict включить сканирование – например через кнопку на Панели инструментов:

Изображение

Страница 1 из 2 Часовой пояс: UTC + 2 часа [ Летнее время ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/