Google объявила о выпуске новых функций искусственного интеллекта и улучшений доступности для Android и Chrome. Ключевое обновление касается сервиса TalkBack — встроенного в Android экранного диктора. Теперь пользователи могут задавать вопросы Gemini о содержимом изображений и экрана, даже если отсутствует альтернативный текст. Например, получив фото гитары от друга, можно узнать её бренд или цвет, а при онлайн-покупках — уточнить материал товара или наличие скидок.
Компания также модернизировала Expressive Captions — функцию генерации субтитров с эмоциональной окраской. Новая опция длительности звука точно передаёт растянутые слова вроде “амаааазинговый удар” или “неееет”. Добавлены метки для звуков: свист, покашливание. Обновление доступно на английском языке в США, Великобритании, Канаде и Австралии для устройств с Android 15 и выше.
В Chrome упрощена работа с PDF: теперь экранный диктор может читать отсканированные документы благодаря технологии OCR (оптического распознавания символов). Дополнительно в мобильной версии браузера появилась функция Page Zoom — увеличение текста без изменения макета страницы. Настройки масштаба применяются выборочно или глобально через меню с тремя точками в правом верхнем углу.
[Рекламный блок мероприятий TechCrunch сохранён в оригинальном формате]