Компьютер научился отличать сказку от были
Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов. Алгоритм, придуманный авторами научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.
Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта "Гутенберг". Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.
Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов - 73,8 процента с погрешностью 5,15 процента.
«Мазда» перелетела яму и перевернулась на крышу в Николаеве: водитель был пьян (фото, видео)
ВАЗ влетел в жилой дом в Николаеве: женщина получила серьезные травмы (фото, видео)
Мужчину с помповым ружьем в руках задержали возле кинотеатра с детьми в Николаеве (видео)
С музыкой в душе и сердце: Николаевский клуб композиторов отметил 9-летие (фото, видео)
КП «Николаевская ритуальная служба» навязывало предпринимателям незаконные договоры, – решение Антимонопольного комитета
«Опель» сбил женщину на пешеходном переходе в Николаеве (видео)
Пара лебедей поселилась на Намыве в Николаеве (видео)
Троллейбус и «Ниссан» столкнулись на перекрестке в центре Николаева (фото, видео)
Праздник любви и дома: в Николаеве поблагодарили семьи, подарившие детям шанс на счастье (фото, видео)













