Dự án trí tuệ nhân tạo nhằm tăng cường ngôn ngữ bản địa ở Brazil

Rất lâu trước khi người Bồ Đào Nha đến Brazil, vào năm 1500, người dân bản địa đã sinh sống trên vùng đất của chúng tôi. Người châu Âu, ngoài việc khám phá các khu vực của Brazil, còn can thiệp vào phong tục tập quán của những người đã sống ở đây, bao gồm cả ngôn ngữ, và một số ngôn ngữ nói đã bị thất truyền. Giờ đây, các nhà khoa học đang sử dụng Trí tuệ nhân tạo để khôi phục và củng cố các ngôn ngữ có nguồn gốc từ Brazil.

Giữa rất nhiều thay đổi về văn hóa, hơn 2/3 ngôn ngữ bản địa đã bị thất truyền theo thời gian, trong khi ngày nay nhiều ngôn ngữ trong số đó ngày càng suy yếu.

QUẢNG CÁO

Để giúp thay đổi kịch bản này, một dự án chung của USP, thông qua Trung tâm Trí tuệ nhân tạo (C4AI) và Nghiên cứu của IBM, nhằm mục đích sử dụng công nghệ Trí tuệ nhân tạo (AI) trong việc tăng cường ngôn ngữ bản địa Brazil.

Sáng kiến ​​này nhằm mục đích tạo ra và phát triển các công cụ giúp ghi chép, bảo tồn, phục hồi và sử dụng các ngôn ngữ này, luôn hợp tác với cộng đồng các nước trên thế giới. người Ấn Độ.

Theo các nhà nghiên cứu liên quan, các nguyên mẫu nghiên cứu đầu tiên có thể được thử nghiệm vào nửa cuối năm 2023.

QUẢNG CÁO

Thông qua lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP), AI có thể trợ giúp, chẳng hạn như trong việc xây dựng hệ thống chuyển đổi giọng nói thành văn bản và ngược lại, trong việc phát triển các công cụ dịch thuật và mở rộng từ vựng, cải thiện việc thu thập và xử lý ngôn ngữ. chương trình phân tích, bên cạnh những tiến bộ công nghệ khác có thể được áp dụng để bảo tồn ngôn ngữ bản địa.

Dự án cũng sẽ khám phá việc tạo ra bàn phím và trình hoàn thiện văn bản cho ngôn ngữ bản địa cũng như việc sử dụng máy tính và robot trong việc giáo dục trẻ em và thanh thiếu niên trong cộng đồng.

“Chúng tôi sẽ hành động chủ yếu trên hai mặt trận. Một trong số đó là tiếp thêm sức sống, tức là tăng số lượng người trẻ nói và viết các ngôn ngữ này. Thứ hai là nhằm mục đích củng cố các ngôn ngữ bản địa đang trong quá trình biến mất, đó là lý do tại sao chúng tôi đang tìm cách ghi lại chúng để có thể lưu giữ cho hậu thế. Ví dụ, có những ngôn ngữ chỉ có ba người nói, tất cả đều đã 70 tuổi. Nhưng điều cơ bản là luôn làm việc với cộng đồng bản địa và các chuyên gia về chủ đề này”, phó giám đốc C4AI, Claudio Pinhanez, một trong những người đứng đầu dự án cùng với giáo sư Luciana Storto, từ Khoa Triết học, Thư từ và Khoa học Con người, giải thích. (FFLCH) từ USP.

QUẢNG CÁO

Thích ứng công nghệ

Công việc đang được tiến hành tại Trung tâm Trí tuệ Nhân tạo USP được chia thành các lĩnh vực quan tâm. Trong mỗi người trong số họ, AI được sử dụng theo một cách cụ thể, luôn hướng tới việc củng cố và sử dụng ngôn ngữ bản địa.

Các nhà nghiên cứu tìm cách điều chỉnh công nghệ AI cho các ngôn ngữ này, tạo ra các công cụ hỗ trợ công việc ngôn ngữ – ví dụ: hệ thống phiên âm ngữ âm, dịch tự động, phân tích ngữ pháp và tạo từ điển kỹ thuật số – ngoài việc sử dụng các ngôn ngữ này trên mạng xã hội và cùng nhau với chatbot nhằm mục đích giáo dục người dân bản địa – một nỗ lực tiên phong.

Pinhanez giải thích rằng, ngày nay, không có người dịch từ ngôn ngữ bản địa sang tiếng Bồ Đào Nha Brazil.

QUẢNG CÁO

“Nếu bạn đặt nó vào ChatGPT, chẳng hạn, anh ấy phát minh ra một ngôn ngữ từ con số không. Nó trình bày một số từ có vẻ như là bản địa nhưng không phải là từ bản địa. Những gì chúng tôi đang phát triển là một công trình chung, cho người dân bản địa thấy những gì chúng tôi có thể làm và lắng nghe những gì họ muốn và cần. Dù gặp rất nhiều khó khăn nhưng chính họ đã đến với chúng tôi và đưa ra những yêu cầu hiện có. Theo các lãnh đạo cộng đồng, mối quan tâm lớn nhất là giới trẻ, những người lớn lên mà thậm chí không biết ngôn ngữ của mình, kể cả khả năng viết. Chúng tôi cho thấy những gì có thể cố gắng và những gì chúng tôi có thể tạo ra. Liệu điều đó có giải quyết được hay không lại là một câu hỏi khác. Những gì chúng tôi thấy cho đến nay là phản hồi rất tốt từ cộng đồng mà chúng tôi đang làm việc cùng, họ thích những gì được đề xuất và chỉ đạo công việc theo nhu cầu của họ. Đó là một quá trình. Công nghệ phải thích ứng với thế giới của họ và họ phải tìm hiểu về công nghệ”, ông nói.

Hợp tác với các trường học bản địa

Hiện tại, dự án có quan hệ đối tác với các trường học ở Vùng đất bản địa Tenonde Porã, phía nam thành phố São Paulo. Mặc dù trẻ em và thanh thiếu niên trong cộng đồng nói thông thạo ngôn ngữ Guarani Mbya nhưng họ vẫn gặp khó khăn trong việc áp dụng ngôn ngữ viết của ngôn ngữ này. Theo nghĩa này, dự án cung cấp các hội thảo hàng tuần với học sinh và giáo viên trung học để các công cụ viết và tài liệu ngôn ngữ có thể được khám phá và phát triển cùng nhau.

“Chúng tôi hài lòng với những xưởng đã được phát triển. Những khoảnh khắc này rất quan trọng để chúng ta suy nghĩ về cách các công cụ công nghệ có thể giúp chúng ta trân trọng tiếng mẹ đẻ của mình bằng cách hỗ trợ sự phát triển khả năng viết, kiến ​​thức và thực tiễn của chúng ta. Hơn nữa, chúng tôi đã suy nghĩ về quá trình dịch thuật và tầm quan trọng của việc sử dụng những công cụ này như một công cụ chính trị để củng cố lối sống của chúng tôi”, lãnh đạo Vùng đất bản địa Tenonde Porã cho biết.

Các công cụ này đang được đồng phát triển với học sinh và giáo viên của trường và được sử dụng trong lớp theo cách thử nghiệm.

QUẢNG CÁO

Một mục tiêu khác của dự án là cho phép các thành viên của họ hình thành và phát triển cộng đồng liên tục, cho phép họ học và dạy nội dung công nghệ thông tin, lập trình, AI và ngôn ngữ học, bên cạnh việc kết nối với các chuyên gia quan tâm đến việc đóng góp vào sức sống của ngôn ngữ người bản địa.

Sáng kiến ​​của C4AI và IBM rất quan trọng vì hầu hết các ngôn ngữ bản địa ở Brazil và thế giới đều có nguy cơ biến mất vào cuối thế kỷ 21. Ngoài việc phải đối mặt với việc bị xâm lược lãnh thổ, lây lan dịch bệnh và phá hủy hệ sinh thái, người dân bản địa còn phải chịu đựng sự áp đặt của các ngôn ngữ châu Âu, nền giáo dục không phân biệt và việc tăng cường quan hệ với thế giới phi bản địa. Sự chuyển đổi kỹ thuật số với internet, điện thoại di động, trò chơi trực tuyến và mạng xã hội đã khiến nhiều người dân bản địa, đặc biệt là trẻ em và thanh thiếu niên, nản lòng trong việc nói và biết ngôn ngữ gốc của họ trong cuộc sống hàng ngày..

Theo nghĩa này, AI có thể được coi là đồng minh của những người này trong việc bảo tồn và tiếp nối nền văn hóa của họ. Với việc sử dụng các công nghệ mới, có thể đối mặt với những thách thức và mối đe dọa mà ngôn ngữ bản địa phải đối mặt và đảm bảo tính liên tục của chúng cho các thế hệ tương lai.

Nhóm tham gia dự án hiện có khoảng 20 người, bao gồm các nhà nghiên cứu, giáo viên, sinh viên nhận học bổng, chuyên gia kỹ thuật và thực tập sinh. Dự án còn có một nghiên cứu sinh sau tiến sĩ, bốn nghiên cứu sinh đại học và một nghiên cứu sinh hỗ trợ kỹ thuật, được hỗ trợ bởi dự án nghiên cứu C4AI, với sự hỗ trợ của Quỹ hỗ trợ nghiên cứu bang São Paulo (Fapesp). Ngoài ra, từ IBM Research còn có một kỹ sư phần mềm, một nghiên cứu sinh tiến sĩ và hai thực tập sinh đại học tham gia.

Sáng kiến ​​này tiếp tục tích cực tìm kiếm các giáo viên, chuyên gia, sinh viên và sinh viên bản địa quan tâm đến việc gia nhập đội. Hơn nữa, ý tưởng là dự án sẽ bao gồm những người bản địa làm giáo viên (ở mọi cấp độ), nhà ngôn ngữ học, lập trình viên, chuyên gia CNTT và dịch giả. C4AI và IBM sẵn sàng đón nhận các mối quan hệ đối tác mới cũng như nhu cầu mở rộng phạm vi của mặt trận công việc quan trọng này.

(Với Báo USP)

Đọc thêm:

* Nội dung bài viết này được tạo ra một phần bằng các công cụ trí tuệ nhân tạo, các mô hình ngôn ngữ tiên tiến hỗ trợ việc soạn thảo, rà soát, dịch thuật và tóm tắt văn bản. Các mục văn bản được tạo bởi Curto Tin tức và phản hồi từ các công cụ AI đã được sử dụng để cải thiện nội dung cuối cùng.
Điều quan trọng cần nhấn mạnh là các công cụ AI chỉ là công cụ và trách nhiệm cuối cùng đối với nội dung được xuất bản thuộc về Curto Tin tức. Bằng cách sử dụng những công cụ này một cách có trách nhiệm và có đạo đức, mục tiêu của chúng tôi là mở rộng khả năng giao tiếp và dân chủ hóa việc tiếp cận thông tin có chất lượng.
🤖

Cuộn lên