Китайский техногигант Tencent открыл публичный доступ к фирменной нейросети Hunyuan Video для генерации коротких роликов по текстовому запросу. Сервис может генерировать фотореалистичные видео и, судя по первым отзывам, сопоставим по качеству с уже известными Sora и Runway.
В основе нейросети лежит мультимодальная модель Hunyuan на 13 млрд параметров. Благодаря ей сервис может создавать ролики с разрешением 1280x720 пикселей длительностью до пяти секунд. По заявлению компании, её усовершенствованная 3D-архитектура VAE обеспечивает визуальную согласованность результата и плавные естественные движения.
Согласно внутренним тестам Tencent, нейросеть «превосходит предыдущие самые современные модели» по части соответствия запросу на 68,5%, а по шкале качества картинки сервис демонстрирует результат в 96,4%. Модель построена на базе открытого исходного кода, но реализация Tencent платная — она использует специальные токены в качестве валюты. На одну генерацию уходит 15 штук. Их можно купить в наборах: 150 кредитов стоят $9,99, 750 — $44,99, 1500 — $79,99.