Đây là một trong chuỗi sự kiện giới thiệu các nền tảng số “Make in Vietnam”
nhằm thực hiện “Chương trình chuyển đổi số quốc gia đến năm 2025, định hướng đến
năm 2030” vừa được Thủ tướng Chính phủ phê duyệt.
Phát biểu tại buổi lễ, Thứ trưởng Bộ Thông tin và Truyền thông Nguyễn Thành Hưng nhận định, Bộ
TT&TT lựa chọn giới thiệu và bảo trợ về truyền thông Nền tảng chuyển
đổi giọng nói tiếng Việt thành văn bản VAIS và Nền tảng giọng nói nhân
tạo tiếng Việt tự nhiên Vbee vì đây là hai nền tảng tiên phong tại Việt
Nam về công nghệ lõi Speech–to–Text và Text–to–Speech sử dụng trí tuệ
nhân tạo để chuyển đổi giữa giọng nói và văn bản tiếng Việt.
Nền tảng VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương
sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội,
Bộ TT&TT, UBND Thành phố Hà Nội, hơn 50 đơn vị báo chí, truyền hình để phục vụ
gỡ băng bài phát biểu tại các kỳ họp, sự kiện. Nền tảng Vbee đã cung cấp dịch vụ
cho hơn 20 ngàn khách hàng cá nhân, hơn 500 doanh nghiệp, tổng công ty, sử dụng
rộng rãi trong 3 lĩnh vực chính: tổng đài tự động, giải pháp tương tác thiết bị
thông minh và nội dung số tự động.
VAIS và Vbee đang đứng trước một thị trường rộng lớn với hơn 96 triệu dân,
700 nghìn doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử
dụng Internet đạt 68,7% (số liệu thống kê năm 2019). Ngoài ra, nền tảng chuyển
đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ
quan Nhà nước với 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh,
thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị
sự nghiệp các cấp.
Đặc biệt, công nghệ giọng nói tiếng Việt có thể được ứng dụng vào các sản
phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm, giúp
người khuyết tật dễ dàng tiếp cận thông tin và sản xuất thông tin, mang lại ý
nghĩa xã hội to lớn.
* VAIS là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành
văn bản (Speech To Text) tiên phong tại Việt Nam, với những đặc trưng:
- Nhận dạng được đầy đủ giọng nói cả 3 miền Bắc, Trung, Nam với độ chính
xác lên đến 95%.
- Chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì, với
tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh.
- Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Đặc biệt, nền
tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…,
hỗ trợ nhiều loại định dạng âm thanh đầu vào.
- Cung cấp giải pháp cho người dùng trực tiếp hoặc kết nối thông qua API tại:
https://vais.vn/.
* Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm
xúc (chuyển đổi văn bản thành giọng nói trí tuệ nhân tạo tiếng Việt có cảm
xúc – Text To Speech) tiên phong tại Việt Nam với những đặc trưng sau:
- Công nghệ Vbee có thể học theo bất kỳ giọng của một người nào đó trong
vòng 4 giờ đồng hồ với độ tương tự trên 95%.
- Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ
tuổi (Nam, Nữ)
- Giọng nói Vbee đa dạng độ tuổi, giới tính (Nam, Nữ)
- Công nghệ giọng nói nhân tạo Vbee có thể dự đoán cách đọc, các từ viết tắt,
từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài
không thể.
- Vbee xây dựng thành công nền tảng Vbee cloud (
https://www.vbee.vn),
cho phép người sử dụng, doanh nghiệp, lập trình viên có thể sử dụng trực
tiếp hoặc qua tích hợp (API) một cách dễ dàng và thuận tiện.
- Vbee đã đóng gói thành công cho các giải pháp toàn diện trong các lĩnh vực
sử dụng giọng nói nhân tạo của Vbee như: giải pháp về nội dung nhân tạo (sách
nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng
đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông
minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư
vấn khách hàng.