● News Intel

Show HN: Gemini can now natively embed video, so I built sub-second video search (Score: 150+ in 5 hours) ...

Важность: 7.5 · 2 источников · 24.03.2026 20:20

Gemini Video Search AI Embeddings Vector Databases AI Hardware LLM Performance Open Source AI

Что произошло Разработчик создал систему поиска видео в реальном времени, используя Gemini Embedding 2, которая нативно встраивает видео в 768-мерное векторное пространство без транскрипции. Параллельно, модель Qwen3.5-397B (107ГБ) была успешно запущена на интегрированном GPU AMD Ryzen AI Max+ 395 (Strix Halo) с 128ГБ унифицированной памяти, достигая 17-19 токенов/с, используя Vulkan. Почему это важно Gemini значительно продвигает мультимодальный ИИ, позволяя прямой векторный поиск по видео, что ускоряет и удешевляет анализ видеоконтента. Запуск Qwen3.5 на iGPU AMD через Vulkan демонстрирует растущую доступность мощных LLM на потребительском оборудовании, снижая зависимость от дорогих дискретных GPU и облачных сервисов, а также обходя проблемы с ROCm. Между строк Google активно укрепляет позиции Gemini в мультимодальном ИИ, особенно в видео, опережая конкурентов, зависящих от текстовых прокси. AMD, через Strix Halo и поддержку Vulkan в сообществе (llama.cpp), бросает вызов доминированию NVIDIA в локальном ИИ, делая ставку на унифицированную память и открытые стандарты. Это указывает на стратегию демократизации ИИ-вычислений. Что отслеживать дальше Официальные API и инструменты Google для Gemini Video Embedding. Доступность и ценообразование AMD Strix Halo и аналогичных APU. Дальнейшие оптимизации llama.cpp для Vulkan и других не-NVIDIA GPU. Сравнение производительности Strix Halo с будущими интегрированными решениями NVIDIA.

Анализ через линзы

INVESTOR

Эти новости указывают на значительное снижение барьеров для внедрения передового ИИ. Нативная встройка видео в Gemini открывает огромный рынок для эффективного поиска и анализа видеоконтента без дорогостоящей транскрипции, что критично для медиа и безопасности. Одновременно, запуск Qwen3.5-397B на потребительском iGPU за ~$2,500 демократизирует доступ к мощным LLM, позволяя создавать новые локальные и конфиденциальные ИИ-приложения, снижая зависимость от облачных вычислений.

Риски: Для Gemini риском является быстрая конкуренция со стороны других мультимодальных моделей, а также зависимость от экосистемы Google. Для Qwen3.5 риски включают потенциальные ограничения производительности для самых требовательных задач и зависимость от конкретного аппаратного обеспечения (AMD iGPU), что может замедлить широкое распространение.

Возможности: Gemini создает возможности для новых SaaS-решений в области видеоаналитики, мониторинга и управления контентом, а также для стартапов, использующих эту технологию. Qwen3.5 открывает рынок для автономных ИИ-продуктов, персональных ассистентов и корпоративных решений с повышенной конфиденциальностью, снижая операционные расходы и стимулируя спрос на мощные интегрированные GPU.

BUILDER

Эти новости демонстрируют прорыв в локальном ИИ и мультимодальных возможностях. Нативное встраивание видео Gemini упрощает видеопоиск и анализ, напрямую проецируя видео в векторное пространство. Одновременно, эффективное выполнение больших LLM (Qwen3.5-397B) на потребительских iGPU через Vulkan демократизирует мощный ИИ, снижая зависимость от облака и открывая путь к приватным edge-решениям.

Риски: Для : Масштабируемость векторных баз данных для огромных объемов видео; потенциальные смещения в моделях встраивания; зависимость от API Gemini. Для : Аппаратная зависимость (конкретные iGPU AMD, большая унифицированная память); зрелость драйверов Vulkan; размер модели (107 ГБ) ограничивает развертывание.

Возможности: Для : Создание продвинутых систем управления видеоконтентом, анализа видеонаблюдения в реальном времени, персонализированных рекомендаций без дорогостоящей транскрипции. Для : Разработка локальных ИИ-помощников, инструментов обработки языка в офлайне и экономичных edge-решений для различных отраслей, интегрируя мощные LLM в потребительскую электронику.

OPERATOR

Эти новости указывают на значительные изменения в обработке данных. Нативное встраивание видео Gemini упрощает анализ контента, а эффективное развертывание LLM на интегрированных GPU демократизирует мощный ИИ на периферии. Это снижает зависимость от облака, влияя на операционные расходы и конфиденциальность данных.

Риски: Высок риск исполнения из-за использования передовых, потенциально неподдерживаемых технологий, таких как Gemini Embedding 2 или Vulkan для LLM [Doc 9211, Doc 9251]. Это требует найма узкоспециализированных кадров, увеличивая сложности рекрутинга и потенциальные сбои в рабочих процессах. Политики соответствия для локальной обработки данных требуют тщательной проработки.

Возможности: Значительное снижение операционных затрат за счет развертывания мощного ИИ на более дешевом локальном оборудовании , уменьшая расходы на облачные вычисления. Улучшенная конфиденциальность данных для чувствительной информации, обрабатываемой на устройстве. Оптимизация рабочих процессов для управления видеоконтентом и поиска устраняет ручную транскрипцию, ускоряя анализ и обнаружение контента.

SKEPTIC

Обе новости демонстрируют впечатляющие технические достижения в области ИИ, однако критический анализ выявляет значительные преувеличения и замалчивание рисков. Скорость поиска видео, вероятно, ограничена масштабом демонстрации, а производительность LLM на интегрированном GPU достигается ценой сильной квантизации и потенциальных проблем с масштабируемостью. За публикациями стоят явные коммерческие интересы производителей аппаратного и программного обеспечения, стремящихся продемонстрировать возможности своих продуктов.

Риски:

• Масштабируемость и стоимость: Высокие требования к ресурсам и потенциально высокая стоимость для больших объемов данных или высоконагруженных сценариев, не раскрытые в статьях.

• Точность и качество: Потенциальное снижение точности или качества вывода из-за использования новых методов (векторный поиск без текста) или сильной квантизации моделей, что не подтверждено исчерпывающими метриками.

• Зависимость от платформ: Сильная привязка к конкретным API (Gemini) или аппаратным платформам (AMD iGPU), что создает риски при изменениях в экосистеме или отсутствии альтернатив.

• Зрелость ПО: Использование новых или менее распространенных стеков ПО (Vulkan с llama.cpp) может привести к проблемам со стабильностью, поддержкой и отсутствием оптимизаций.

• Этические и приватные риски: Возможность злоупотребления технологиями быстрого поиска по видео для массовой слежки или несанкционированной идентификации.

Возможности:

• Доступность ИИ: Снижение барьера входа для запуска мощных ИИ-моделей на более доступном оборудовании, что демократизирует доступ к передовым технологиям.

• Новые парадигмы поиска: Развитие более интуитивных и эффективных методов поиска по неструктурированным данным (видео) без промежуточных текстовых представлений, открывая новые сценарии использования.

• Инновации в аппаратном обеспечении: Стимулирование развития интегрированных GPU и унифицированной памяти для задач ИИ, что может привести к созданию более энергоэффективных и компактных решений.

• Развитие открытого ПО: Демонстрация гибкости и возможностей таких проектов, как llama.cpp, способствующих развитию открытых стандартов и инструментов в области ИИ.

2 источника

Show HN: Gemini can now natively embed video, so I built sub-second video search (Score: 150+ in 5 hours) ...

t.me · 24.03.2026 20:20 · 8.0

Qwen3.5-397B at 17-19 tok/s on a Strix Halo iGPU — all 61 layers on GPU via Vulkan (not ROCm)

reddit.com · 24.03.2026 21:57 · 7.0

Хочешь такие брифы каждый день?

AI анализирует 145+ источников, фильтрует шум и выделяет главное — бесплатно.

Зарегистрироваться