Инженеры, блять. Ну да, раскачать машину, а содержимое багажника, бачков, бардачка... всё что незакреплено внутри будет летать
Вторая рука занята уже
libimobiledevice / pymobiledevice3 в помощь. Удивишься. Внезано оказывается, что и приложения инсталить можно (с оговорками) и запукать их. И доступ к файловой системе появляется.
О да, мои любимые кандидаты, которые не ориентируются в основах.
И сколько картинок? +/-
Зайдём с другой стороны, сколько бит в хеше? Что используется для расстояния хемминга сейчас?
Про точность я не говорю, я пока говорю только про сужение пространства поиска. Раз SURF даёт хороший результат, но поиск по всему массиву картинок дорого - начни с того, чтобы сузить пространство поиска. Практика говорит о том, что если не делать "универсальное" решение - всегда найдётся возможность срезать углы какие-то. Я-бы тут начал с 3х вещей:
1. классификатор(грубо говоря определили что это аниме арт - отбрасываем не аниме картинки)
2. преобладающие цвета(эту технику вообще недооценивают, т.к. любой туториал начинается с "переводим в грейскейл", бонусом тут идёт инвариантность относительно размеров, соотношения сторон).
3. попробовал-бы гистограммы цвета. Решение элеметарное, очень "в лоб", но кажется зайдёт для такого контента хорошо
теги не пользовательские, а то что через классификатор получится
Препроцессинг картинок всех через классификатор, грубо говоря - выясняем теги и свойства типа "перобладающие цвета"
Когда на вход баянометра подаётся картинка - тоже проганяется через классификатор и поиск производится через только через пространство тех картинок у которых совпадают теги (часть тегов). Это позволит отсеивать кууучу сорцов которые явно не совпадут.