Вопрос не в том, что человек хочет обмануть баянометр. Вопрос в том, что человек нашел чтото на просторах интернета, он не знает, это кроп, не кроп, и ему хочеться запостить. К примеру. Оригинал:
clickhouse использовать точно не буду. Разработка яндекса
Дополнительные признаки не работают. Работали б - уже давно сделал бы. Можешь почитать комментарии выше
Да, используются хеши ключевых точек. Подскажи базу данных, которая позволяет искать по хешам используя расстояние Хэмминга, при этом делает это быстро для огромного количества данных
Уже используется
Цветовая маска - цветокор передает привет, вместе с картинками с текстом.
Соотношение сторон - кроп передает привет
Идею я понял, сократить количество возможных вариантов с миллионов до десятков тысяч - сотен тысяч, но оно не сильно помогает. Потому нужно сокращать количество до сотен. При среднем количестве точек в 500/картинку будет приемлемая скорость поиска. А как можно это сделать? Квадраты - хуйня. Сделать их маленькими - будет тьма данных. Сделать их большими - не будет ловить нужные. Цветовая маска не работает. Соотношение сторон тоже. Что еще можно использовать? Количество точек на изображении? При сжатии режутся градиенты, и на их месте появляються ложно положительные точки, потому даже для внешне одинаковых изображений, количество точек может отличаться в разы. Легкий blur, что бы убрать эти ступеньки, существенно увеличивает количество кожно положительных срабатываний
Еще одна вариация точек...
Да, не вопрос, наверное она работает, и работает хорошо. Как быстро производить поиск по 7 лямов изображений. Вот главный вопрос
Нужен. 8 лет назад - тем более баян. Кешировать результаты поиска пробовал, но это архи пиздец. Поиск по диску, это часы...
Вы не особо представляете на сколько это громадный объем данных
Я когда то их ковырял, но было это лет 5 назад. Они себя довольно хорошо показывали в тестах, но, у них тогда была главная проблема - кроп. ORB/SIFT/SURF очень не очень в плане скорости и ресурсов, но, они позволяют искать картинки даже имея только маленький кусочек ее. Это крайне специфическое требование, но оно нужно в рамках задач реактора. Куча постов с тянками, где одна фул, вторая - без головы, третья - только жопа, четвертая - только грудь
Пробовал чтото подобное, с разбиением картинки на квадраты. Работало оно плохо, потому что ты не можешь предугадать какой будет кроп. Может быть такое, что нужно будет найти по кусочку как раз на стыке квадратов и результата или не будет, или будет ложно положительный