Google подобрява алгоритъма за изчисляване рейтинга на уеб-страниците
Досега Google понижаваше рейтинга PageRank на уеб-страниците с малко посещения. Сега става възможно понижаването рейтинга и на страници, които съдържат недостоверни факти.В научната работа Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources се описва алгоритъм, който може да извлича фактите от уеб-страниците, да различава грешките на генератора на уеб-страници от фактологичните грешки в текста, а след това да изчислява нивото на достоверност на текста в уеб-страницата (Knowledge-Based Trust, KBT). Тази оценка понякога е по-обективна от PageRank и може да значително да уточни неговото значение.Създаден е и нов математически модел, който пресмята рейтинга на няколко страници от един и същи уеб-сайт, който оказва влияние върху формирането на окончателния рейтинг на конкретна уеб-страница.Новата технология е проверена върху 119 милиона уеб-страници и 5,6 милиона уеб-сайтове, данните от които са сравнени с база данни с 2,9 милиарда факта. Подобен мащабен тест се прави за първи пътЗасега използването на коефициента за достоверност KBT само е предложен да бъде вмъкнат при формиране резултатите на търсачката, но новата технология може успешно да се използвана например при Уикипедия, за съставяне на списъци с "жълти" сайтове, за извеждане на сложни статистически данни и други.
Коментари
Все още няма коментари