Черный список Google Instant
Сеть Новости IT и Интернета

    Авторы издания «2600: The Hacker Quarterly» решили составить список слов, запрещенных Живым поиском Google Instant.

    За исключением некоторых очень специфичных случаев, Google можно заподозрить в чем угодно, но только не в цензуре. Однако, как уже говорилось, есть ряд слов, с которыми гигантский по объему Живой поиск отказывается иметь дело.

    Можно прекрасно понять намерения Google. Его команда пытается удостовериться, что никто не увидит ссылки на порнографические или содержащие насилие ресурсы, которые могли бы принести немало беспокойств (за исключением случаев, когда вы и впрямь разыскиваете именно их). Спрошенная об этом пару недель назад Джоанна Райт из Google ответила, что ограничения введены с целью защиты детей.

    Но легко заметить, что тем самым Google подвергает немалому риску собственный имидж, ибо эти пропуски в лучшем случае заведут в тупик, а в худшем – заденут вспыльчивые чувства особой категории щепетильных (и продвинутых) пользователей, которые не смогут взять в толк, по каким именно правилам работает Живой поиск Google.

    Например, слова «бисексуал» и «лесби» находятся среди запрещенных. Наберите их в Google – и Живой поиск тут же остановит выдачу в своем окне вариантов поиска. И вы должны будете нажать на «Ввод», чтоб удостоверить: да, я действительно хочу узнать нечто, имеющее отношение к бисексуалам или лесбийской любви.

    Почему Google блокирует эти слова?


    У вас, конечно, есть возможность искать и находить в Google подобные слова. Вопрос лишь в том, что при их наборе Живой поиск буквально с ходу перестанет выдавать свой список вариантов, и вы должны уже самостоятельно жать на «Ввод», чтобы увидеть нужные ссылки.

    Это происходит потому, что Живой поиск вообще никак не пользуется тем, что вы набрали в строке поиска, для отображения результатов. Он попросту читает данные, что были собраны на протяжении многих лет относительно всех предыдущих пользовательских поисков, пытаясь загодя предугадать, что вы намерились набрать в пустой строке. Точно тот же алгоритм положен в основу автозаполнения строки по технологии Google Suggest – в старом, не столь «мгновенном» поисковике Google.

    И если в выпадающем окне не предлагается готовых слов и словосочетаний – после того, как вы набрали «лесби» или «жопа» – то вовсе не по той причине, что эти результаты заблокированы внутренней цензурой. Просто Google пытается предотвратить появление перед вами текста оскорбительного содержания, который пользователи уже искали и находили в прошлом, – в случае, если на самом деле вы ищете нечто вполне безвредное и безобидное. (Ранее мы уже вели полемику на эту тему).

    Бессчетное количество пользователей ассоциируют слово «лесби» с понятием «порно», вводя словосочетания, которые не должны попасться детям на глаза. Именно поэтому алгоритм Google решает не вываливать вам тут же 20 ссылок на лесби-порносайты, даже если эти ссылки самые частотные в базе данных алгоритма.

    Обратившись с этим вопросом к самому Google, мы получили следующий комментарий от уполномоченного лица:

    «Существует ряд причин, по которым вы, быть может, не увидите искомые слова на ту или иную тему. Например, мы ставим жесткий фильтр на порнографию, сцены насилия и дискриминационные сюжеты. Хотелось бы отметить, что удаление запроса из функции автозаполнения – довольно тяжкая, технологически, задача, далеко не такая простая, как всего лишь черный список запрещенных слов и фраз.

    Мы получаем более миллиарда запросов ежедневно – и посему применяем алгоритмический подход к фильтрации и удалениям, который, разумеется, далеко не идеален (как и поисковый алгоритм). Но мы продолжаем усиленно работать над его усовершенствованием, внимательнейшим образом читая все ваши пожелания и возражения.

    Наш алгоритм направлен не только на особые слова, но и на сложные запросы, которые на них основаны, причем на всех представленных в Google языках. Например, если это некое плохое слово на русском языке, мы также удаляем соответствующее сложносоставное слово, включая его транслитерацию латиницей. Кроме того, мы обращаем внимание на сам итог вашего поиска. Например, если возникает впечатление, что он является порнографическим, наш алгоритм может воспрепятствовать применению к нему опции автозаполнения, даже если сам запрос не нарушает вышеизложенных правил. На сегодняшний день наша система, разумеется, неидеальна и не столь быстродейственна, сколь хотелось бы, но мы постоянно работаем над ее улучшением».

    Высокоэффективный алгоритм SafeSearch по-прежнему активен в Живом поиске. Он способен довольно действенно отфильтровывать потенциально оскорбительный контент, который может появиться после того, как пользователь жмет на «Ввод». Например, первая страница результатов, выданная на запрос о «лесби» при умеренной степени защиты, оказалась совершенно безобидной.

    Да, нынешняя разработка Google далека от совершенства – и представители компании это подтверждают. По крайней мере, мы хотели б получить возможность вручную устанавливать параметры на некоторые широко распространенные понятия и слова, запрещенные лишь вследствие того, что иногда они бывают связаны с сексуальным, насильственным или дискриминационным контентом.

    Представители Google утверждают, что постоянно трудятся над улучшением своей системы, однако не предоставляют ни малейших уточнений, какие именно изменения нас в будущем могут ожидать. Так что пока, ежели есть на то потребность, можете проверить полный список цензуированных слов на сайте «2006: The Hacker Quarterly».
    Источник: habrahabr.ru



    Дочитали статью до конца? Пожалуйста, примите участие в обсуждении, выскажите свою точку зрения, либо просто проставьте оценку статье.

    Вы также можете:

    • Перейти на главную и ознакомиться с самыми интересными постами дня
    • Добавить статью в заметки на: Добавить эту статью в TwitterДобавить эту статью ВконтактеДобавить эту статью в FacebookПоделиться В Моем Мире
    • Добавить на Яндекс

    • 0
    • 08 октября 2010, 12:57
    • patron

    Специальные предложения


    Резиновая плитка для пола «Модуль»

    Вулканизированная резина для пола в тренажерном зале обладает исключительной прочностью и укладывается как полы для занятий штангой и спортивные мобильные тяжелоатлетические площадки на улице. Покрытие не крошится и не впитывает влагу, это литая вулканизированная резина, не крошка! Покрытие послужит незаменимым полом в ангары для хранения мотоциклов, снегоходов, лодок, гидроциклов, катеров и яхт…

    Резиновое покрытие Трансформер «ЗЕРНО»

    Уникальное напольное покрытие из резины для быстрой и самостоятельной сборки пола в гараже. Полы в личном гараже Вы можете собрать своими руками, без привлечения строителей. Удобный предустановленный замок, позволит произвести монтаж резиновых плит без применения клея. Покрытие устойчиво к шипам, износу и проливу технических масел и бензина…

    Модульная плитка ПВХ для пола

    Модульная плитка ПВХ для пола в гараж, автосервис, цех, торгово-развлекательный центр, офис, фитнес и тренажерный зал, зрительный зал кинотеатра, склад. Модульные плитки ПВХ настолько просты в монтаже, что не требуют специальных навыков для своей установки. Неподготовленный человек может собрать более 100 кв.м. напольного покрытия за один рабочий день. Для сборки не требуется клей, цемент и другие крепежные материалы...


    +7 (495) 969-75-83

    +7 (495) 969-75-83

    +7 (495) 969-75-83

    Смотреть все предложения...

    Новостная сеть блогов MyWebS - это всё самое актуальное: основные мировые новости, лучшие фотографии из последних новостей. А также просто полезная и занимательная информация: о событиях в России, о достижениях в мире технологий, о загадочном и непостижимом, об исторических фактах и просто о знаменательных событиях.

    © Copyright 2010–2018