mercredi 21 juin 2023

Mai Bá Kiếm – Quốc hội Việt Nam : Hai mươi lăm năm từ rã băng đến nhận dạng tiếng nói

 

MẤT 25 NĂM, QUỐC HỘI CẢI TIẾN NGHIỆP VỤ “RÃ BĂNG PHIÊN CHẤT VẤN” THÀNH “NHẬN DẠNG TIẾNG NÓI CHUYỂN RA VĂN BẢN”

Tôi được cử đi tường thuật Quốc hội (QH) từ kỳ họp 7 khóa 8 (tháng 6&7/1990) dưới sự chủ trì của Chủ tịch QH Lê Quang Đạo (không là Ủy viên Bộ Chính trị).

Đây là kỳ họp đầu tiên QH cho phép các báo địa phương, báo ngành và đoàn thể đi dự! Từ kỳ họp 6 khóa 8 trở về trước chỉ có: Thông tấn xã Việt Nam, Nhân Dân, Quân đội Nhân dân, Đài Truyền hình Việt Nam, Đài Tiếng nói Việt Nam, Tiền Phong, Đại Đoàn Kết độc quyền tường thuật. Báo địa phương cứ cóp và dán các bài báo này.

Các báo trên viết theo “bài báo mẫu”:

“Sáng ngày… trong không khí tưng bừng của ngày hội lớn, Quốc hội đã long trọng khai mạc kỳ họp…, đến dự có đồng chí Tổng bí thư… ủy viên Ban chấp hành Trung ương, ủy viên Bộ Chính trị; đồng chí chủ tich nước… ủy viên Ban chấp hành Trung ương, ủy viên Bộ Chính trị; Đ/c Thủ tướng… ủy viên Ban chấp hành Trung ương, ủy viên Bộ Chính trị; đồng chí chủ tịch Quốc hội…ủy viên Ban chấp hành Trung ương, ủy viên Bộ Chính trị... Chủ tịch đoàn kỳ họp gồm có các đồng chí…”. Nhưng nội dung cuộc họp ngắn gọn, không cụ thể, chi tiết.

Kỳ họp 6 khóa 8 tạo cạnh tranh thông tin giữa các báo phía Nam. Tôi ghi sổ tay, vừa ghi âm cassette mini, gạch đít các câu nói hay vào phút thứ mấy kể từ đầu phiên họp. Khi viết bài, tôi quay ngược băng đúng phút đó để nghe chính xác câu nói. Các phóng viên ỷ lại thu âm, ra hành lang hút thuốc, về tòa soạn nghe lại cuộc họp dài 4 tiếng, bị Ban biên tập hối nộp bài, càng viết không ra chữ!

Nhiều báo trích dẫn câu nói hay không chính xác, đại biểu bực mình đòi đính chính. Văn phòng QH khóa 9 (Ông Vũ Mão làm chánh, TS Nguyễn Sĩ Dũng làm phó) thuê 30 sinh viên “rã băng” (tai nghe earphone, tay gõ phím) lời thoại trong phiên chất vấn. Các sinh viên Hà Nội khó nghe giọng Trung và Nam thường mở ngoặc (không nghe rõ). “Rã băng” ra câu cụt, câu què, mà còn chậm (đầu giờ chiều có văn bản phiên chất vấn buổi sáng, đầu giờ sáng hôm sau có văn bản phiên chất vấn buổi chiều), không giúp phóng viên viết nhanh, mà chỉ để đối chiếu lời trích đúng hay sai.

Năm 2021, tôi nghỉ hưu 10 năm, quên chuyện QH. Tình cờ Đỗ Hiệp gọi ra quán gặp Phạm Tấn Anh Vũ (nguyên phóng viên báo Doanh nhân Sài Gòn và Sài Gòn Tiếp Thị), mới biết Anh Vũ là thành viên trong nhóm tác giả viết “phần mềm nhận dạng tiếng nói thành chữ viết”, được ứng dụng trong phiên chất vấn của QH. Độc chiêu nhất, phần mềm nhận dạng được tiếng nói của ba. miền chuyển thành văn bản có độ chính xác: miền Bắc 99%, miền Trung 85%-90%, miền Nam 90%.

Nhóm tác giả đã tìm ra các bộ phát âm chuẩn của cả ba miền và phải mất 8 năm nghiên cứu, mới viết xong phần mềm nhận dạng địa danh, tên người và ngày tháng được chuyển hóa dưới dạng viết hoa và con số. Đã nhất là phần mềm nhận dạng giọng nói thành văn bản có thể chuyển thành dấu (chấm, phết, hỏi, hai chấm, chấm than…) tùy theo ngữ điệu và ngắt câu của người nói.

Tính bảo mật dữ liệu cao khi cơ sở dữ liệu được ghi tại chính đơn vị tổ chức cuộc họp đó. Phần mềm có thể nhận dạng giọng nói trong môi trường nhiễu âm, tiếng ồn với khoảng cách tối đa 6 mét. Tính năng chuyển giọng nói thành văn bản theo thời gian thực, khi ứng dụng ở các cuộc họp kéo dài cả ngày là bước “đại nhảy vọt” của nhóm tác giả. Nhóm tác giả đã ứng dụng phần mềm trong điện thoại. Thầy giáo, sinh viên, học sinh, nhà báo, nhà văn, luật sư, điều tra viên, hội đồng xét xử… đều có lợi khi sử dụng.

Chủ tọa phiên chất vấn QH và thư ký kỳ họp khỏi mất công ghi lời thoại vừa thiếu sót, vừa thiếu chính xác! Họ chỉ ngó vào màn hình, lời thoại biến thành câu chữ, giúp chủ tọa điều hành phiên chất vấn chính xác, hiệu quả và chất lượng. Các nhà báo tường thuật cũng khỏe re, cứ ngồi cantine uống bia hơi và tám đã miệng, rồi cuối giờ trưa và chiều, đến Văn phòng Quốc hội lấy văn bản về tha hồ cào bàn phím!

Ảnh: Sinh viên “rã băng” kỳ họp 11, khóa 10.

MAI BÁ KIẾM 21.06.2023

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.