06.04.2009, 17:30:40
Версия для печати | PDA/КПК  
Нормальное случайное распределение, часто используемое в различных статистических моделях (в том числе и поиска слов). Изображение с сайта isutech.org
Нормальное случайное распределение, часто используемое в различных статистических моделях (в том числе и поиска слов). Изображение с сайта isutech.org

Квантовая математика поможет в поиске ключевых слов

Испанские ученые создали новый алгоритм поиска в тексте ключевых слов, основанный на использовании теории случайных матриц, сообщает New Scientist. Работа ученых опубликована в журнале Physical Review E.

Самый простой метод поиска ключевых слов в тексте заключается в следующем. Чтобы определить, является ли слово ключевым, изучается частота его повторения в тексте. Затем частота того же слова определяется для некоторого базового текста, привязанного к изучаемому из некоторых сторонних соображений. Если частота в исходном тексте оказывается выше, чем в базовом, то слово признается ключевым.

В рамках нового исследования ученые предложили считать не только частоту вхождения слов, но их группировку. Ученые полагают, что более важные слова обычно группируются автором вместе, в тех частях текста, где он пытается донести основную мысль. При этом менее значимые слова оказываются более равномерно распределены в тексте.

Для описания данной идеи исследователи использовали так называемую теорию случайных матриц - раздел теории вероятности и статистики, занимающийся изучением случайных величин, которые принимают матричные значения. Оказалось, что многие математические методы данной теории представляется возможным применять к изучению текстов.

В качестве тестирования своего метода ученые предприняли попытку обнаружить ключевые слова в нескольких известных текстах на разных языках: английском, немецком, испанском, итальянском и латыни. Опыт оказался достаточно успешным. Например, в труде Эйнштейна, посвященном общей и специальной теориям относительности, в первую десятку ключевых слов новый метод поместил "поле" (field) и "гравитационный" (gravitational). В "Трех мушкетерах" Александра Дюма первую строчку оккупировала "миледи", а Атос оказался важнее д'Артаньяна. Полный список изучавшихся текстов доступен здесь.

Кроме этого исследователи провели тестирование нового метода в текстах, предварительно удалив из них пробелы. Результаты, по словам исследователей, указывают на то, что новый метод может применяться для изучения абстрактных массивов данных.

Создатели нового метода позиционируют его в качестве будущего метода для интернет-поиска. Специалисты в данной области, однако, пока настроены скептически. Они полагают, что, прежде чем можно будет говорить о практическом применении нового метода, необходимо провести сравнительное тестирование с существующими методами поиска.



[ Обсудить с другими читателями ]
[ Сообщить о найденной опечатке ]
URL: http://lenta.ru/news/2009/04/06/quantum/  
Последние новости
27.05 22:16 "Любовь" Михаэля Ханеке получила главный приз Канн
27.05 17:53 Марк Уэббер выиграл Гран-при Монако
27.05 17:27 Митинг оппозиции в Тбилиси собрал несколько десятков тысяч человек
27.05 17:24 На юго-востоке Москвы застрелен мужчина

Аутсайд

Hosted.ap.org: Wanted: Bigfoot hair samples for European study
И немного лженауки! Ученые проведут генетический анализ волос Бигфута, чтобы узнать, что же это за таинственное создание
CPA Australia: An Audience with Neil Armstrong
Уникальное интервью с Нилом Армстронгом. Оно уникально потому, что он почти не дает интервью в принципе
Andr? Kuipers: A small step towards Mars
Оказывается будущей марсианской миссии можно помочь диетой. Узнай по ссылке как!
NASA: Canadarm2 to Catch SpaceX's Dragon on its Maiden Voyage to the ISS
Красивая канадская компьютерная графика, в которой наглядно показано, как Dragon пристыкуется к МКС
Washington Post: How Thomas Edison, Mark Zuckerberg and Iron Man are holding back American innovation
История о том, как идея ученых-одиночек мешает инновациям. Хм, интересно, откуда в американской газете типично российская лексика?

Прогресс
26.05 05:31 Европейский грузовик скорректировал орбиту МКС
25.05 20:12 Первый частный космический грузовик пристыковался к МКС
25.05 19:03 Компьютер сумел отличить улыбку от усмешки
25.05 18:20 Крупнейший в мире радиотелескоп разделят на две страны
25.05 17:00 Марсианский углерод оказался вулканическим
25.05 13:57 Самолет на солнечных батареях завершил первую часть рекордного перелета

Предположительный внешний вид ихтиостеги. Изображение с сайта arizona.edu
25.05 12:08
Ученые выяснили, что первые наземные животные не умели ходить
Самые интересные
24.05 19:04
Ученые выбрали занятные организмы, открытые в 2012 году
24.05 12:16
Астроном нашел доказательства существования "планеты Икс"

 
© ООО "Лента.Ру" (1999-2012)
Лицензия Минпечати Эл No ФС77-42043
Дизайн — Студия Артемия Лебедева, 2004
О сервере | Реклама | Письмо в редакцию | Техподдержка
Система Orphus Ramler_Top_100