
Калі коратка: мы не выйшлі ў закрытую бэту не таму, што “не паспелі”, а таму што не хочам выпускаць сырую рэч, якая расчаруе вас у першыя ж хвіліны.
TTS — адна з галоўных прычын. Для HOLAS гэта не “дэталь”, гэта ядро ўсяго досведу.
За апошні час мы прагналі некалькі варыянтаў:
- Gemini
- OpenAI
- ElevenLabs
- Speechify
- беларуская мадэль Bextts ад TuteishyGPT
І вось сумленны стан спраў на сёння:
- Gemini — на нашым бягучым этапе гэта лепшы баланс кошт + якасць + хуткасць. Але ёсць нюанс: мадэль яшчэ сыраватая — часам не дагаворвае фразы да канца.
- OpenAI — вельмі годная якасць і хуткая генерацыя, але эканоміка пакуль не сыходзіцца: у некалькі разоў даражэй за Google у нашым сцэнары.
- ElevenLabs — вельмі чыстае вымаўленне, сапраўды ўражвае, але ў нашых тэстах павольней і у некалькі разоў даражэй за Google.
- Speechify — на дадзены момант не дае нам дастатковай хуткасці і якасці вымаўлення для таго ўзроўню, які мы хочам.
- Bextts / TuteishyGPT — калі казаць менавіта пра беларускую вымову, гэта адзін з самых цікавых і чыстых варыянтаў. Але ёсць інфраструктурная рэальнасць: для стабільнай працы патрэбны магутны GPU-сервер, што азначае сотні еўра ў месяц толькі за 1 сервер.
Што далей?
Гэта не стоп-фактар, а часовы этап: працягваем будаваць увесь софт вакол TTS, каб HOLAS быў карысны не толькі “калі голас ідэальны”, але і ў рэальным жыцці.
І так — мы ўжо разглядаем выхад у закрытую бэту нават з кампрамісамі, калі яны разумныя і празрыста камунікуюцца.
Нам важная ваша зваротная сувязь:
- Ці карысталіся б вы HOLAS, калі часам будуць хібы вымаўлення?
- Які кошт месячнай падпіскі на старце вы лічыце адэкватным?
Пішыце фідбэк у Instagram, LinkedIn або Telegram — нам гэта вельмі дапаможа.