Компьютер научился отличать сказку от были
Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов. Алгоритм, придуманный авторами научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.
Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта "Гутенберг". Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.
Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов - 73,8 процента с погрешностью 5,15 процента.
«125 лет любви к животным»: директор зоопарка рассказал о жизни, животных и людях (фото)
В центре Киева горел отель: эвакуировали 57 человек (видео)
Обледеневшие центральные улицы Николаева начали посыпать реагентами (видео)
В Николаевской и 19 областях проходит спецоперация по поиску уклонистов: 128 обысков, 110 подозреваемых
В комнатах +5: в Николаеве общежитию без отопления отключили свет - люди вышли протестовать
Николаев в плену у гололеда – городские власти демонстрируют полную беспомощность (фоторепортаж)
«З Україною в серці»: для николаевцев выступили ведущие артисты одесского театра (фото, видео)
Трое россиян сдались в плен украинскому роботизированному комплексу (видео)
Как выглядит рынок в Германии: сравнение цен в Баден-Бадене и Николаеве (видео)













