Алгоритмы поиска

Категория: Разное

Как уже говорилось, применяемые поисковиками алгоритмы являются их ноу-хау. Тем не менее о некоторых закономерностях, которые используются при разработке алгоритмов и предшествующему их применению анализу текста, поговорить стоит.

Некоторые из этих закономерностей были подмечены Джорджем Зипфом (George К. Zipf); он опубликовал свои законы в 1949 году. Пять лет спустя знаменитый мате матик Беноит Мандлеброт (Benoit Mandlebrot) внес небольшие изменения в формулы Зипфа, добившись более точного соответствия теории практике. Хотя некоторые ис следователи и подвергают исследования Зипфа острой критике, без учета подмечен ных им закономерностей сегодня не способна работать ни одна система автоматиче ского поиска информации.

Зипф заметил, что длинные слова встречаются в тексте реже, чем короткие (по-видимому, это как-то связано с природной ленью человека и вообще любого живого существа). На основе этой закономерности Зипф вывел два закона.

Первый из них связывает частоту появления того или иного слова в каком-то тексте (она называется частота вхождения слова) с рангом этой частоты. Read the rest of this entry »

Время публикации: January 16th, 2010. А запостил admin

Как работают поисковые машины

Категория: Интернет

В предыдущей главе мы уже коснулись этого вопроса. (Собственно говоря, мы коснулись в ней очень многих вопросов, чтобы вы могли провести поиск срочно по надобившейся информации, не читая всей книги.) Теперь мы поговорим об этом не сколько подробнее.

Для того чтобы уметь пользоваться поисковой машиной (или поисковой систе мой), не обязательно понимать, как она работает, и тем более знать ее внутреннее устройство. Однако ситуация здесь примерно такая же, как с автомобилем: на нем можно ездить, умея лишь заправлять его, управлять им и зная правила дорожного движения. Но тот, кто хочет чувствовать себя за рулем уверенно и при необходимости самостоятельно устранять мелкие неисправности, должен знать устройство автомоби ля, названия и принципы функционирования хотя бы важнейших узлов. Read the rest of this entry »

Время публикации: January 15th, 2010. А запостил admin

Простой поиск – выводы

Категория: SEO вопросы

Простой поиск можно провести с помощью броузера, например, такую возмож ность предоставляет Internet Explorer. Однако он проводит поиск не сам, а нанимает для этого одну из информационно-поисковых систем; для России это могут быть поисковые серверы Yandex, Rambler, Апорт и, конечно же, ИПС MSN Research компании Microsoft. К этим поисковым ресурсам броузер обращается после довательно. Но на экран при этом выводится ограниченное количество информации о найденных сайтах и документах. Кроме того, при посредничестве броузера можно провести поиск только по ключевым словам, в то время как в некоторых случаях бы вает удобнее воспользоваться поисковым каталогом.

Для поисковых каталогов характерно то, что сайты, включаемые в них, просматривают ся редакторами каталогов. Read the rest of this entry »

Время публикации: January 6th, 2010. А запостил admin

Каталоги и поисковые машины

Категория: История Интернета

Условно все ИПС можно разделить на два типа — кататоги и поисковые машины. Мы говорим условно, потому что любой поисковый каталог сейчас обязательно предлагает и услуги поисковой машины. И наоборот, многие поисковые машины предлагают заранее сузить область поиска, выбрав или тему поиска, или хотя бы ее область (искать во всей сети Internet, только товары и услуги, только новости и статьи и т.д.). У поискового сервера каждого из названных типов есть свои преимущества и недостатки, и тот из них, который хорошо подходит для одних целей, значительно уступает конкурентам при решении иных задач.

Вес ИПС можно условно разделить на два типа — поисковые каталоги и поисковые машины. У каждой из названных ИПС есть свои преимущества и недостатки. Read the rest of this entry »

Время публикации: January 3rd, 2010. А запостил admin

Категории

Партнеры сайта

Облако меток

Все права защищены. RichSEO, 2010.       Санкт-Петербург, Невский пр., д.188, к.3, оф.175