Спецы ассемблера
И это вся информация?Где они находятся, какой размер, как часто нужно сравнивать, какие типы данных нужно сравнивать и т.п.?
Вначале нужно определить где узкое место, а после уже думать как с ним бороться.
где они находятся: текстовой файл TSV.
какой размер: пока что 80 миллионов строк.
как часто нужно сравнивать: время от времени.
какие типы данных нужно сравнивать: текст, присвоил каждому хомяку хеш, коллизии маловероятны.
где узкое место, а после уже думать как с ним бороться: пока что интересуюсь где выборка быстрей?
***
Население Земли 8 миллиардов, выборка по Германии 80 миллионов, далее ещё выборка...
и из этого списка нужно найти 8 хомяков, если это делать в питоне то выглядит это так:
c.execute("SELECT homjak FROM homjak WHERE homjak IN (SELECT homjak FROM homjak_de)")
Вопрос заключается в том, какие алгоритмы сортировки и поиска задействованы в SQL базах?
Допустим если писать на ассемблере, то я начну тупо перебирать строку за строкой, сравнивать,
а если дописать алгоритм, то уже можно будет прыгать к начальной букве (тоесть сократить диапазон)
Вопросы и Ответы - Программируем калькулятор пособий для беженцев вместе.