Đặc biệt, báo chí và truyền thông là đối tượng có tỷ lệ lỗi chính tả cao nhất. Đánh giá này được rút ra từ kết quả đợt xếp hạng tháng 6/2010 về tình hình chính tả trong văn bản tiếng Việt của một nhóm các nhà khoa học thuộc Viện Công nghệ Thông tin Đại học Quốc gia Hà Nội và Trung tâm Nghiên cứu phát triển Công nghệ GRID (công ty VIEGRID JSC).
Đợt xếp hạng này đã đánh giá 177 đơn vị và xếp hạng 132 đơn vị (theo trang web
xephangvanban.com) bao gồm 7 khu vực: 1) Bộ và Văn phòng Trung ương; 2) Ủy ban nhân dân Tỉnh và Thành phố trực thuộc Trung ương; 3) Cơ quan thuộc Chính phủ và thuộc Bộ; 4) Đại học và Viện nghiên cứu; 5) Báo chí, nhà xuất bản và cơ quan truyền thông; 6) Doanh nghiệp Việt nam; 7) Tổ chức và doanh nghiệp nước ngoài tại Việt Nam.
Lỗi chính tả tiếng Việt dày đặc trong một văn bản gói gọn trên trang A4. Ảnh: TN |
Các kết quả đánh giá chi tiết được công bố trên trang Web www.xephangvanban.com cho thấy, tỷ lệ lỗi chính tả cao nhất như sau: “soi mói” 74,33%,“sáng lạn” 41,66%, “cọ sát” 28,38% và “thăm quan” 20,61%.
Khu vực báo chí và truyền thông có tỷ lệ lỗi chính tả cao nhất, gần mức báo động 10%. Đặc biệt, Đài tiếng nói Việt Nam là cơ quan truyền thông lớn của Chính phủ, có tỷ lệ lỗi hơn 30%, đứng đầu về tỷ lệ lỗi.
Khu vực Đại học và Viện nghiên cứu có tỷ lệ lỗi xấp xỉ mức trung bình của xã hội, chưa phát huy được sự mẫu mực và tiên phong trong vấn đề dùng chữ nghĩa. Đặc biệt, cả hai khu vực này đều có các đại diện có tỷ lệ lỗi vượt mức 30%.
Khu vực chính quyền địa phương, và các cơ quan thuộc chính phủ, thuộc Bộ có tỷ lệ lỗi chính tả khá cao. Đặc biệt, có đơn vị có tỷ lệ lỗi gần 40%.
Ngay cả các khu vực khá nhất là doanh nghiệp và các Bộ vẫn còn phải tiếp tục cải thiện chất lượng để có thể đạt được mức 1%.
Kết quả nói trên đã phản ánh tình hình báo động của chính tả tiếng Việt. Ông Nguyễn Ái Việt, Phó Viện trưởng Viện CNTT, Đại học Quốc gia Hà Nội, thành viên của nhóm tác giả chia sẻ, công bố xếp hạng này với mong muốn cố gắng giúp toàn thể xã hội và các đơn vị được xếp hạng bước đầu nhận thức được tầm quan trọng của vấn đề chính tả tiếng Việt.
Các đợt đánh giá tiếp sau sẽ được tiến hành 3 tháng một lần và sẽ liên tục được mở rộng về quy mô để hậu thuẫn cho một chiến dịch cộng đồng về quét lỗi chính tả.
Việc giới thiệu các sản phẩm soát lỗi chính tả tiếng Việt một cách khách quan trong bản đánh giá xephangvanban sẽ là cần thiết cho chiến dịch quét lỗi chính tả. Dựa trên một phân tích thống kê, nhóm tác giả đã ước lượng được tỷ lệ giữa lỗi phi từ và lỗi thực từ là 31.69%: 68.31%.
Trái với quan niệm của một số chuyên gia CNTT, khác với trong tiếng Anh, lỗi thực từ chiếm đa số trong tiếng Việt. Điều đó có thể giải thích tại sao, các sản phẩm không có khả năng quét lỗi thực từ đã không nhận được hưởng ứng mạnh mẽ từ phía người dùng.
Để đánh giá khách quan, nhóm tác giả đã đề nghị sử dụng các độ đo như độ nhận biết, độ chính xác và khả năng gợi ý để đánh giá hiệu năng cho các phần mềm soát lỗi. Nhóm chuyên gia cũng đưa ra độ đo VIE: độ đo cân bằng giữa các yếu tố nói trên và tỷ lệ với tần số xuất hiện các lỗi phi từ và lỗi từ thực.
Được biết, trước khi đánh giá chất lượng chính tả văn bản tiếng Việt, nhóm tác giả đã tiến hành một cuộc điều tra nhỏ trong hai nhóm Chuyên gia ngôn ngữ và Chuyên gia CNTT: Nhóm chuyên gia ngôn ngữ yêu cầu tỷ lệ lỗi chính tả trong văn bản Việt phải là dưới 1%. Nhóm chuyên gia CNTT chấp nhận tỷ lệ này trong khoảng 2,5-5%.
Cả hai nhóm chuyên gia đều nhất trí cho rằng báo chí và truyền thông có trách nhiệm nhiều nhất đối với tình hình chính tả tiếng Việt. Tuyệt đại đa số các chuyên gia cũng cho rằng tỷ lệ 10% là ngưỡng báo động đối với các lỗi chính tả và 30% là ngưỡng mà một lỗi chính tả đã trở thành một cách viết có thể đồng thời được chấp nhận.
Trong tương lai, các doanh nghiệp, chuyên gia và người sử dụng có thể tiếp tục giới thiệu các sản phẩm mới giúp ích cho chính tả tiếng Việt với cộng đồng trên trang Web
ww.xephangvanban.com.