· Начало · Статистика · WASM.RU · Noir.Ru ·

 WASM Phorum (Оффлайн - 24.11.2003) —› WASM.RESEARCH —› Распознавание изображения

Посл.отвђт Сообщенiе


Дата: Сен 28, 2003 18:56:06

Вопрос хоть и не совсем в тему, но это реверсинг чистой воды :), так что спрошу...
Мой ОПСОС разрешает отправлять смс-ки с ихнего сайта только если ввести код, формируемый в виде изображения.
Ну... вы наверное видели такое - типа цифорки/буковки там всякие на аляповатом фоне.
А хотца автоматизировать процесс отправки смс на телефон, для чего необходимо реверснуть это изображение в исходный вид, то есть в строку.

Я так думаю надо делать следующее:
1. Чистим картинку. Это уже работает, причем достаточно неплохо.
2. Выделяем символы. Это тоже уже работает... почти :)
3. Распознаем их. Тут я думаю запихнуть все это в нейросеть и пускай она сама думает.

Никто таким не занимался? Может уже готовое чего-то есть?
Может кто видел алгоритмы формирования таких изображений - тогда проще было бы понять куда копать...


Дата: Сен 28, 2003 19:06:12

Может уже готовое чего-то есть?
Есть :)
На http://www.madwizard.org/ лежит готовая нейросеть для распознавания рукописных символов. Чистый masm32, кстати.


Дата: Сен 28, 2003 20:19:31

Quantum
Max

Прикольная тема-то, а :)
Только небезопасная.


Дата: Сен 28, 2003 21:26:57

Ещё такие каракули выдают при регистрации на Hotmail :-)

volodya
Только небезопасная
;-)
Если в образовательных целях, то вполне простительно.


Дата: Сен 28, 2003 22:08:12

Просвятите, почему не безопасная??


Дата: Сен 28, 2003 22:27:49

Asterix
Когда ты снимаешь защиту с программы для личного пользования и никому об этом не сообщаешь, то никаких проблем возникнуть не должно. Другое дело - обойти онлайновую защиту на виду у всех...


Дата: Сен 29, 2003 11:13:33

Никто таким не занимался? Может уже готовое чего-то есть?

Эту технологию используют уже все продвинутые..
Вот может и на WASM добавим :)))

Тут нужно отметить, что есть

1. Плохо продвинутые
2. Хорошо...

Плохо продвинутые используют генерирование gif/jpeg из сотавных частей.
То есть цифры там -- это всегда одни и неже jif

Нейронные сети здесь конечно -- круто, но не нужно.

В большенстве случаев распознование можно сделать как поиск заведомо НУЖНОГО участка и его соответствия шаблонным участкам.

Для этого нейронная сеть не нужна.

Хотя Mail.ru уже использует RND значения фона и помехи, чтобы задушить нейросети...

Например несколько простых алгоритмов рахноцветных помех и затуманивая пришлось состряпать и мне :))) правда на PHP.

Главное что простых, потому что это PHP там всё должно быть просто.. иначе лучше С.


Дата: Сен 29, 2003 11:16:39

Другое дело - обойти онлайновую защиту на виду у всех...

Что значит ОБОЙТИ ЗАЩИТУ???
Не, это не сикюрити -- это антиспам. И разница есть.

Если то, что вы делаете -- это не спам.

===============================================
На счёт SMS он посылается через smtp поэтому узнайте через какие и как...
Сделайте как это делает ICQ.


Дата: Сен 29, 2003 13:38:58

Max - научишься хорошо распознавать такие картинки (для проверки возьми www.mail.com и www.e-gold.com ) - стукнись мне в аську получишь хорошую денежку -)


Дата: Сен 29, 2003 15:16:13

rst
Всю ночь сегодня трахался с этой штукой.
В результате уже могу выделять символы, осталось их только распознать. Нейросеть сегодня упорно не хотела их выучивать, но это мы поправим :)
Боюсь, что универсальную распознавалку врядли получится написать, надо будет затачивать ее под каждый конкретный случай. Мне достался достаточно простой вариант (примеры в аттаче), но тем не менее тут имеем "расползание" символов (чуть выше/ниже/левее/правее) и "слияние" символов.

Проблема тут в том, что символы при выделении имеют разную ширину ("1" шире чем "8"), и их надо нормировать для того, чтобы получить одинаковое количество пикселов в символе для подачи на нейросеть. Я это пока делаю это через StretchDraw, что приводит к небольшому ухудшению изображений.

Вообщем, будем пробовать

rst
Посмотрел на mail.com, там изображения конечно посерьезнее, но зато у них нет наползания символов друг на друга, так что в какой-то мере и проще.

751433569__pic.zip


Дата: Сен 29, 2003 20:26:39

Попробуй посмотри turning numbers с логин-паги еголда - там даже на глаз с трудом определить можно что за символы, не то, что программно.


Дата: Окт 1, 2003 19:13:23

Edmond
В большенстве случаев распознование можно сделать как поиск заведомо НУЖНОГО участка и его соответствия шаблонным участкам
Спасибо за наводку, нейросеть действительно не понадобилась - из 62 символов 1 ошибка.

Теперь есть еще вопрос, скорее к знатокам http.
Допустим есть эксплорер, работающий через прокси.
Допустим моя прога допускает ошибку в распознавании, о чем узнает по ответу http сервера. При этом я хочу сделать еще одну попытку распознавания (т.е. загрузить страничку по новой, т.е. как бы нажать refresh).
Вопрос, что делает эксплорер при нажатии на рефреш - он просто анулирует свой кэш, или сообщает прокси-серверу, чтобы тот сбросил свой кэш?
Короче, как мне загрузить страничку так, чтобы она не была взята из кэша?


Дата: Окт 1, 2003 21:56:41

доку по wininet почитай. Там при запросе можно указать - брать из кыша или нет. Вариант №2 - URlDownloadToCacheFile - там вроде тоже не из кыша берется


Powered by miniBB 1.6 © 2001-2002
Время загрузки страницы (сек.): 0.102