В разделах языковое и общество
Андрей Баксаляр  :: 19 фев, в 09:00

Нижний, конечно, не Екатеринбург (с его Plov Project-ом), но здесь тоже выражен большой спрос на надписи «на английском». Выглядит нелепо, но зато, наверное, модно и молодежно!

Cooleebeen


Частотный словарь от mc.hertzbeat.ru

Для собственных небольших исследований сделал частотный словарь из базы статей агрегатора mc.hertzbeat.ru. Было обработано около 600 МБ очищенного текста (~130 тысяч новостных статей), в основном — это срез избранных и самых популярных статей российской прессы (с уклоном в IT-издания) за последние два года. Общий размер словаря — 840 тысяч слов.

Оказалось, что по «популярности» в прессе Android (10 692 упоминания) превосходит iOS (4 664 упоминания) и iPhone (9 431 упоминание), а Google (18 045) заборола Apple (17 080), но всех, конечно же, победил Путин (20 878 упоминаний). При этом Обама (3 783) конкурирует с Песковым (3730), а Навальный (3 443 упоминания) затмил wi-fi (3 109) и ИГИЛ (1037).

Подумалось, что такой частотный словарь (своего рода свежий срез СМИ) может кому-то пригодиться, поэтому наслаждайтесь:

В несжатом виде (~10 МБ)
В сжатом виде (~3 МБ)
То же самое на github-е, плюс там, возможно, будут появляться обновления...


В разделах интернет и языковое
Андрей Баксаляр  :: 25 мар 2016, в 21:05

Инструменты для пыток

Базовые пыточные принадлежности:

Аддресс
Аккустика
Алладин
Андронный коллайдер
Анимэ
Асвальт
Безплатно
Болелемение
В крации
В купе
Вкурсе
Броется
Вообщем
Вротарь
Всмысле
Впринцепи
Врятле
Выйграл
Делема
Дёшего
Дибил
Едит
Завтро
Зделать
Извени
Ихний
Какуето
Касяк
Канечно
Конешно
Касатка
Киллограм
Координально
Лудше
Низнаю
Ньюанс
Однёрка
Пасспорт
Пачему
Прасти
Пожалуйсто
Помойму
Правельно
Пробывать
Ризетка
Симпотичный
Скаченный
Сосиська
Спосибо
Траффик
Тубаретка
Удолить

Уф, все, это уже через чур!


В разделах программирование и языковое
Андрей Баксаляр  :: 9 мар 2016, в 12:48

Странная библиотека

Сейчас работаю над небольшим проектом для транслитерации большинства популярных языков мира в английские идентификаторы и ищу всякие материалы для работы с естественным языком. Словари и всякое такое. Для языков группы CJK было необходимо найти частотные словари (это такие словари, собирающие самые часто используемые слова в простые текстовые списки) и в этом поиске наткнулся на отличный ресурс на… внезапно — самой Википедии. Там есть раздел, в котором собраны частотные словари для многих языков — Wiktionary: Frequency Lists. Для тех, кто работает в области обработки естественного языка — очень хорошая штука.


В разделах языковое и мир
Андрей Баксаляр  :: 16 фев 2016, в 18:00

Карта концентрации населенных пунктов России, названия которых оканчиваются на «ка» (что характерно для деревень и прочих городков, выросших из сёл, нап. «Матвеевка»):

Населенные пункты, название которых оканчивается на ка

А также карта РФ, показывающая, где «кучкуются» населенные пункты, содержащие в своем названии прилагательные «великий» и «большой» (в разных склонениях):

Населенные пункты, название которых оканчивается на ка

Данные: OpenStreetMap.


В разделах юмор и мобильные гаджеты
Андрей Баксаляр  :: 16 дек 2015, в 22:42

Девайсы под торговой маркой VEGA

Когда что-то продаешь в русскоязычных странах под брендом VEGA, стоит очень внимательно относиться к подбору шрифтов. Очень!


В разделах литература и языковое
Андрей Баксаляр  :: 26 окт 2015, в 22:50

Временами встречаются прямо-таки вопиющие случаи мастерского перевода названий произведений с английского (да или любого другого) языка на русский. Перед нами очередной такой экземпляр:

Так выглядит обложка оригинальной книги:

Street Smarts: Adventures on the Road and in the Markets

Книга называется «Street Smarts: Adventures on the Road and in the Markets», что переводится как «Законы улицы: приключения в путешествиях и на рынках».

А так выглядит обложка той же книги, переведенной на русский язык:

Будущее глазами одного из самых влиятельных инвесторов в мире. Почему Азия станет доминировать, у России есть хорошие шансы, а Европа и Америка продолжат падение

Название издателем «Манн, Иванов и Фербер» изменено на совершенно другое, как обычно, о своем — наболевшем: «Будущее глазами одного из самых влиятельных инвесторов в мире. Почему Азия станет доминировать, у России есть хорошие шансы, а Европа и Америка продолжат падение».

P.S. Как пишут читатели, про Россию там вообще практически ничего нет, и ничего общего содержание книги даже близко не имеет с русским названием. Ни о каком БУДУЩЕМ там речи не идет, это просто мемуары человека о событиях, происходивших 50 лет назад.


В разделах литература , языковое и софт
Андрей Баксаляр  :: 10 янв 2015, в 21:31

Для себя нашел две отличные и очень удобные программы под Android, которыми можно пользоваться как по отдельности, так и в связке. Это — Cool Reader, название которого ничуть не пытается ввести в заблуждение (действительно, классная читалка для электронных книжек) и словарная оболочка Fora Dictionary.

CoolReader + Fora

Cool Reader поддерживает все удобные форматы электронных книжек, в то время как Fora тоже поддерживает большое количество форматов словарей. Например, я сходу подключил к оболочке мощные английские словари Multitran, а также всякие словари Lingvo. Что интересно, Fora хитро индексирует эти словари и очень быстро по ним ищет — выборка из миллионов статей происходит в мгновение ока, прямо во время набора слова.

Но самая магия начинается, когда два этих приложения работают в симбиозе. Допустим, я открываю книгу на английском языке, читаю ее и внезапно встречаю незнакомое слово или даже фразу. Что я делал раньше? Я выходил из читалки, запускал браузер и искал перевод слова там. А если интернета не было, запускал не шибко богатый словарь и пытался найти каждое слово там. Потом переключался обратно в читалку. Уходило на эти манипуляции довольно много времени и часто приходилось дергаться туда-сюда.

Сейчас же сценарий действий такой. Я читаю в читалке книгу, если встречается непонятное слово, я жму на него пальцем два раза:

CoolReader

И моментально получаю полнейший перевод со всеми смыслами:

Fora

А если необходимо перевести фразу, я не отпускаю пальца после двойного тапа от экрана и растягиваю выделение до нужного предела. После этого снизу всплывает небольшая менюшка — там я жму «A > Z»:

CoolReader

И получаю все тот же полный перевод:

Fora

Чтение на языке оригинала становится невероятно быстрым, комфортным и, что немаловажно, полезным (в плане изучения языка). Кстати, книжка, которую я читаю сейчас — тот самый «Марсианин». Пока все очень нравится — вполне себе научно, правдоподобно и интересно, как дочитаю — напишу небольшую рецензию.

Скачать Fora Dictionary и Cool Reader можно без труда, воспользовавшись Гуглом — обе программы бесплатны.


В разделах интернет и языковое
Андрей Баксаляр  :: 12 сен 2014, в 10:04

По долгу службы постоянно приходится подыскивать синонимы, чтобы интереснее и разнообразнее выражать мысли. Синонимы — вообще полезная штука, спасающая от косноязычности и развивающая навыки «вербальной трансляции» мыслей.

Словарь синонимов русского языка

Для быстрого поиска синонимов пользуюсь отличным словарем ASIS от В.Н. Тришина. Он разрабатывается с 93-го года и до сих пор актуален (последняя версия вышла в августе 2014 года). Для наполнения активно используется тонна других словарей, газеты, книги и интернет.

Для себя использую удобную веб-морду к ASIS — минималистичный и практичный «Словарь русских синонимов» от jeck.ru. Кроме всего прочего, поддерживает морфологию. В общем, рекомендую, если у вас есть такая потребность.


В разделах юмор , мобильные гаджеты и софт
Андрей Баксаляр  :: 18 май 2014, в 21:41

Вчера Гугл приобрел компанию Quest Visual, разработавшую еще в 2009 году самую настоящую технологию будущего — Word Lens. Софт ставится на смартфон, затем камера смартфона наводится на какой-нибудь знак на непонятном языке, после чего текст со знака моментально считывается, переводится на ваш язык и вставляется на место непонятных слов — все на лету, практически в режиме реального времени. Это — в перспективе — одновременно и революционная и эволюционная разработка и еще один небольшой шажок в светлое будущее.

Ошибки распознавания и перевода World Lens

Однако не для всех языковых пар она работает полностью корректно. В честь продажи Google, разработчик сделал приложение бесплатным, и интересующиеся технологией русскоговорящие граждане решили «потестить» прорывную разработку, оценить на что она способна в полевых условиях, так сказать. Местами я смеялся до слез.

Ошибки распознавания и перевода World Lens

Импотенция профессионально!

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Обратите отдельное внимание на кнопку «Синус»:

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Ошибки распознавания и перевода World Lens

Это первая страница
1 / 2

Войти через...


Это даст читателю возможность голоса, комментария, создания закладки, и даже написания поста, не говоря о множестве других мелких ништяков.

Популярное


Путешествия Макса Майорова во времени 21 фев, в 00:53

Cool-ибин 19 фев, в 09:00

Неоновый Китай 8 фев, в 06:32

По США на товарняках 2 апр, в 14:12

Новое Оно на подходе 30 мар, в 15:45

Соациализируемся


Также найти меня можно в других злачных местах:

Все еще использую электронную почту:
andreybaksalyar@ya.ru