Навязчивую CAPTCHA используют для оцифровки книг

В культовым футуристическим кино нашего детства «Терминатор» люди не могли отличать киборгов от настоящего человека — для этой цели использовали собак. Хотя пока и неизвестно о существовании искусственного интеллекта, близкого к человеческому, однако проблема определения «робот или человек» незаметно сделалась актуальной.

В Сети дэвэлоўпэры сайтов вынуждены использовать различные изобретения для того, чтобы давать возможность коммуникации на своих площадках только людям, но не рекламным ботом. Навязчивая для юзеров CAPTCHA основывается на том, что человек способен распознать буквы даже на очень сложной ипостаси, которую машинным альгарытмам разгадать не просто. Американские ученые реализовали идею, которая не упрощает страдания пользователей, однако может дать возможность использовать их с большей пользой.

 

По данным ученых из Carnegie Mellon University, каждый день люди по всему миру проходят тесты CAPTCHA более 60 миллионов раз, тратя в каждом случае несколько секунд на различение искаженных символов. Это огромное войско и решили воспользоваться хитрые американские ученые. Они надеются, что пользователи Сети, сами того не подозревая, помогут в осуществлении проекта оцифровки миллионов книг.

Технология CAPTCHA, разработанная в 2000 году, созданная для определения, кто пользуется системой — человек или машина. Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочитать и ввести слово, изображенное на картинке намеренно искаженными буквами. CAPTCHA используется для предотвращения отправки массовых сообщений спам-ботами.

Созданная американскими учеными технология reCAPTCHA позволяет сочетать возможности человека в распазнаньні текста со способностью машин быстро обрабатывать большие объемы информации. Во время эксперимента программа была размещена на 40 тысячах сайтов. Каждый юзер, который проходил тест, получал картинку со словом из книги, неверно распазнаным программой, а также контрольное слово. При точном распазнаньні пользователям контрольного слова, программа считала, что и слово из книги он распознал верно.

Как сообщают авторы исследования в журнале Science, точность системы reCAPTCHA достигала 99,1%, в то время как достоверность программ автоматического распознавания текстов составило лишь 83,5%.

Получить пакет ReCAPTCA для своего сайта может каждый, стащив его с recaptcha.net.

Обсуждение закрыто.