Karachee (karachee) wrote,
Karachee
karachee

Category:

Фильтруем джемпеги

Подходы к проблеме отделения фотографий от рисунков.

1) Сбор данных. Берем рисунок и делаем с него "соскобы", скажем попиксельно слева направо снимаем 12 линий равномерно разнесенных по рисунку, читаем цвета. Получаем при этом массив (Х1-ХN) с индексами цвета.

2)Выявление рисунка

2.1 по методу "поиска заливки". В зависимости от объема массива ищем совпадения цвета в группе рядомстоящих пикселей Хк, Хк+1, Хк+2, ... Хк+n. Чем меньше рисунок(меньше массив) тем меньше может быть n, соотвтетсвенно точность падает.

2.2 по методу "строгой пятнистости" Во всем массиве анализируем присутствие одинаковых цветов в процентном отношении, преобладание одного цвета в количестве более Х%(предполодительно 25-30) скорее всего указывает на наличие рисунка. Возможно дополнительное сканирование этого объекта с другими соскобами (12 линий смещенных относительно первоначальных) и дополнительным анализом.

2.3 по методу "нереальных цветов" предварительно создается каталог цветовых решений не встречающихся на фотографиях. Для этого тербуется пересканировать порядка 100 фотографий в файлах джемпег и забить таблицу частоты появления того или иного цвета. Если в массиве содержится до Х%(более 3-5) цвета не попавшего в массив то скорее всего у нас не фотография.

Сюда же 2.3 бис. Нейросеть , либо анализатор совпадения частот проявляения того или иного цвета/цветовых сочетаний нехарактерных для фотографий. Но это несколько медленнее, чем хотелось бы. Впрочем надо посмотреть сколько времени длиться "взятие данных", если частотный анализ будет в десять раз короче, тогда не критично.

Пока все, что пришло в голову. Кстати на основе 2.3бис легко можно создать коммерческий фильтр против порносайтов составив частотную таблицу именно цветовых сочетаний для различных вариантов человеческой кожи. Програмка анализруя кэш легко вычислит картинки на которых площадь показанных тел превышает допустимую :)))
Subscribe

  • В этот день 8 лет назад

    Главной новостью в 2013-м была акула, которая в красном море нападала на туристов. До Украины ещё целый год, до ковида шесть лет. Другая вселенная,…

  • история одного комментария

    "Иванс Бобровс" : Небольшой нюанс: мифический вирус SARS-Cov-2 до сих пор никем не выделен.) karachee: Я долго думал, что человек…

  • устаревшая модель

    В одном лесу жил тигр. Он ловил косуль и оленей, хорошо питался, был толстым и лоснился. Быть тигром было хорошо. Потом в лесу появился ещё один…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments