Gemini 3.5 Live Translate анонсирована Google
Gemini 3.5 Live Translate переводит речь в реальном времени, сохраняя интонации и темп. Работает с 70+ языками, но может ошибаться при акцентах и фоновом шуме.
Компания Google сделала анонс своей новой аудиомодели - Gemini 3.5 Live Translate. Это специализированная моель, которая позволяет в реальном времени переводить речь собеседника. То есть включив её, ты сможешь разговаривать с иностранцами на понятном тебе языке.

Модель умеет распозновать более 70 языков. Она сама определяет, на каком языке говорит твой собеседник и автоматически настраивается на него. Причём переводит она сохраняя интонации, темп и высоту голоса, что довольно важно для понимания в некоторых языках.
У модели есть и минусы:
- Голос может меняться после длинных пауз, менять пол или наоборот «застревать» на одном голосе при быстрой смене спикеров
- Распознавание языка затрудняется при сильном акценте, похожих языках (например, испанский и португальский) или быстром переключении между языками
- Фоновый шум может искажать
- Она понимает только голосовые — текст не поддерживается
В общем, рассказывать врачам в незнакомой стране, как этот длинный предмет оказался у тебя в заднем проходе, станет немного проще.
Понравилась статья?
Оцените материал — это поможет нам делать лучше.