Структура файлового словаря открытых средств проверки правописания

Есть ли какие-либо документы или руководства с объяснением файловой структуры словарей FreeDict, Aspell, Hunspell / OpenOffice, особенно в отношении переключателей в конце каждой строки в каждом .dic файле? Я предполагаю, что переключатели описывают семантическую интерпретацию слова, будь то

  • имя существительное
  • имя прилагательное
  • наречие
  • наречный
  • и Т. Д.

или любое сочетание вышеперечисленного. Но я не знаю, как сопоставить их с символами переключателя.

Мне также интересно, что описывает .aff файл.


person Nordlöw    schedule 24.10.2011    source источник


Ответы (3)


Это выглядит хорошей отправной точкой, и загрузки на этой странице могут содержать документацию нужного формата.

person NoBugs    schedule 25.05.2012

Вот пара ссылок, которые могут вам помочь:

это в sthackoverflow: Какой формат у словарей OpenOffice?

этот второй - хорошее начало

http://sourceforge.net/apps/mediawiki/freedict/index.php?title=Main_Page

надеюсь это поможет

person Daniele B    schedule 26.05.2012

В Hunspell теги, которые вы выбираете, произвольны, они не имеют другого значения, кроме того, которое вы им присваиваете. Вы можете использовать буквы, цифры (1-65535) и многое другое.

Файл аффиксов описывает многие вещи, но в основном касается того, как слова изменяются.

Например:

$ test.dic
4
apple/a
banana/a
green/b
small/b

$ test.aff
SFX a Y 2 # Allow the following 2 suffixes to words with the "a" flag.
SFX a 0 s . # An "s" at the end for words ending in any letter (signified by the dot). "Apples" and "bananas". 
SFX a 0 s' . # "Apples'" and "bananas'".

SFX b Y 2
SFX b 0 er . # "Greener" and "smaller".
SFX b 0 est . # "Greenest" and "smallest".

Руководство подробно объясняет большинство вещей. Есть также тестовые файлы, которые можно посмотреть.

person Pillowcase    schedule 01.12.2013