Пушыстый (_winnie) wrote,
Пушыстый
_winnie

Category:

*.aff, *.dic files

В FireFox есть словари, из них можно сгенерить длинный словарь всех известных ему слов. Хранятся они в сжатом виде, корни слов с указанием типа слова (спряжения/рода/..) + правила генерации окончаний.

Как это сделать:

1) установить или скомпилировать hunspell, что бы появилась программа unmunch (под cygwin без проблем сработало ./configure + make)

2)
cd 'c:\Program Files (x86)\Mozilla Firefox\dictionaries\'
unmunch ./ru.dic ru.aff >word.txt 2>err.txt


в word.txt будет список всех слов, известных файрфоксу. Дальше можно ставить какие-нибудь эксперименты, типа сколько слов оканчивается как "потреблять" или "заштрихуй" или "скакать" или "огнеупорно"
Tags: soft-dev, tips
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 10 comments