?

Log in

No account? Create an account
nyaload

Журнал Пушыстого

Журнал Пушыстого

Previous Entry Share Next Entry
gmail
nyaload
_winnie
в gmail просмотр html-ек внутри rar-архивов не работает. Вместо html показывается (подсвеченный) код html-страницы. Видимо, интерфейс gmail сделали веб-дизайнеры (шутка). Не уверен, что интерфейс где нет подменю "открыть как" может удовлетворить и профессионалов, и казуальных пользователей.

Тем не менее, уметь смотреть документы внутри rar-архивов - очень круто, я считаю. Ещё gmail научился автоматически определять какие письма важные, какие нет. Большого потока писем у меня нет, но вроде пока угадывает. И умеет отвечать на вопрос "почему". Типа "я считаю письмо важным из-за отправителя".

Возможно, некоторые алгоритмы machine learning можно потвикать, что бы считать не только результат в виде одного float, но и отвечать на вопрос "почему". Картинкой или списком наиболее повлиявших факторов.

Как ни странно, но поиск внутри почты в gmail - очень-очень хреновый. Нет ни морфологии, ни возможности поиска по префиксу слова. А я не помню в каком падеже я написал "яблочный".


  • 1
> Возможно, некоторые алгоритмы machine learning можно потвикать, что бы считать не только результат в виде одного float, но и отвечать на вопрос "почему". Картинкой или списком наиболее повлиявших факторов.
Ага, то, из-за чего я в одной задачке в прошлом похоронил нейронные сети. Научить их было можно, а понять, что вызвало ошибку - нельзя.

Я профан в нейросетях (только знаю базовые основы в теории), но неужели нельзя найти наиболее значимые коэффициенты в финальной линейной комбинации, выяснить какие части исходных факторов (части картинки) наиболее значимо повлияли на эти коэффициенты? Можно даже картинку красить в цветовой код, какие части наиболее значимы.

Ну, собственно определить значимость параметров - ещё можно попытаться (хотя бы померить расстояние до другого класса при движении по каждой из координат). Но вот извлечь более интересную информацию (значимость объектов обучающей выборки и причины, по которым данный объект попал не в тот класс, в который должен) - весьма нетривиальная задача.

(Да, я говорю про наиболее распространенный тип сетей - многослойный перцептрон или как его там, обучаемый методом обратного распространения ошибки. Для сетей Кохонена, к примеру, ситуация значительно приятнее).

Помнится какие-то байесовские спам-фильтры умели коэффициент разложенным по составляющим суммы присылать в отладочном режиме. Опять же, для какой-нибудь экспертной системы на прологе отладочный вывод наверное будет забавно выглядеть.

>Нет ни морфологии
"яблочный morph:on" работает?

Круто, так работает! Спасибо.

Но примитивную морфологию (либо поиск по префиксу "яблочн") ожидаешь по умолчанию сейчас от всех веб-интерфейсов включая магазины, вместо "ничего не найдено".

А на запрос "in:spam watches morph:on" почему-то ничего не нашёл, хотя если убрать morph:on находит кучу писем с watches

Поддержка rar-архивов в гмыле штука неоднозначная. Архив, включающий .exe, .cmd или какие ещё гуглонелюбимые файлы эта гадина слать отказывается, заботясь о блаженных. Приходится паковать в .7z.

Цепочка зла:
Если не отсылается обычных архив, используем
1) Запароленный архив
Если запароленные архивы запрещены, используем
2) Запароленный архив в обычном архиве
Если вложенные запароленные архивы запрещены
3) http://www.steike.com/code/useless/zip-file-quine/droste.zip
И пусть пидарасы сдохнут в адских корчах.

С гмылом отношений не имел, если интересно — посовокупляйте их по цепочке.

А у меня задача добрая, внутренний билд клиентам разослать, так что лучше 7z. :)

Можно банально расширение файла сменить на _zip_ и все.

Да-да, неявное открытие архивов плюс это очень хорошо сочетаются.

Нужно потестить.

Ну и да, открывать как HTML можно по меньшей мере двумя разными способами. Должно быть "открыть где", а это virtual environment и всё такое.

  • 1