DeepMind меняет правила игры: новая система оценки интеллекта нейросетей
Старые тесты AI больше не работают — и это официальная позиция, потому что Google DeepMind представила новую систему оценки интеллекта нейросетей, которая должна заменить устаревшие подходы вроде теста Тьюринга и стандартных бенчмарков.
Проблема в том, что современные модели уже переросли классические тесты: они показывают высокие результаты, но это не значит, что они действительно понимают или мыслят на уровне человека. Поэтому рынок AI сейчас находится в странной ситуации — модели становятся мощнее, но объективно измерить их интеллект становится все сложнее.
Разберем, что предложил DeepMind и почему это может стать новой основой для оценки искусственного интеллекта.