Как вариант можешь попробовать что то по типу «Разделяй и властвуй», если конечно не пробовал.
Взять простую hash функцию которая при сравнении выдает хороший false negative близкий к 0, ну и конечно со средненькими остальными параметрами, но не с отвратительными.
Я не знаю какие варианты изменения картинок должны быть учтены, но как пример преобразовывать картинку до квадрата 2*2 и отсортировать цвета, можно в rgb, но можно и в hls. Можно и 1 доминирующий конечно взять, тут сильно зависит от входных данных.
Собрать hash со всех текущих картинок и кластеризовать с помощью к примеру c-means, прийдется с параметрами повозится, но надо решить по количеству кластеров дабы разбить на нормальное количество групп нормального размера.
При поиске выполнять hash для картинки и проверять к каким кластерам он относится с определенным порогом, далее уже можно использовать более традиционные методы, которые работают на меньших объемах данных.
Как вариант если hash не учитывает какие либо преобразования, то при поиске для картинки можно вычислять hash несколько раз до преобразования и после, далее сравнивать с теми кластерами с которыми похожи.
Это позволит уменьшить время для поиска. Так как вычисление hash не должно быть сложным, сравнение с центрами кластеров также простая операция. А далее пойдут более тяжелые операции на меньших объемах.
И чего такого? У тебя 4 ядра.
1 ядро полностью ест excel + чутка другого.
Подтверждение моим словам можно увидеть снизу, там указана общая загруженность и сколько простаивает.
Взять простую hash функцию которая при сравнении выдает хороший false negative близкий к 0, ну и конечно со средненькими остальными параметрами, но не с отвратительными.
Я не знаю какие варианты изменения картинок должны быть учтены, но как пример преобразовывать картинку до квадрата 2*2 и отсортировать цвета, можно в rgb, но можно и в hls. Можно и 1 доминирующий конечно взять, тут сильно зависит от входных данных.
Собрать hash со всех текущих картинок и кластеризовать с помощью к примеру c-means, прийдется с параметрами повозится, но надо решить по количеству кластеров дабы разбить на нормальное количество групп нормального размера.
При поиске выполнять hash для картинки и проверять к каким кластерам он относится с определенным порогом, далее уже можно использовать более традиционные методы, которые работают на меньших объемах данных.
Как вариант если hash не учитывает какие либо преобразования, то при поиске для картинки можно вычислять hash несколько раз до преобразования и после, далее сравнивать с теми кластерами с которыми похожи.
Это позволит уменьшить время для поиска. Так как вычисление hash не должно быть сложным, сравнение с центрами кластеров также простая операция. А далее пойдут более тяжелые операции на меньших объемах.
https://www.taobao.com/list/item/642658660921.htm
Чтоб не открылась реклама нужно попасть в маленький квадратик.
На некоторой рекламе он довольно сильно отходит от центра
1 ядро полностью ест excel + чутка другого.
Подтверждение моим словам можно увидеть снизу, там указана общая загруженность и сколько простаивает.