Gjigandi i teknologjisë Meta ka zbuluar një model gjuhësor mbresëlënës të bazuar në AI, të quajtur The Massively Multilingual Speech Project (MMS), i cili mund të njohë mbi 4000 gjuhë nga e gjithë bota dhe të “flasë” ose të prodhojë të folur në më shumë se 1000 prej tyre.
Ngjashëm me sistemet e tyre të tjera të AI, MMS do të jetë i disponueshëm si një mjet me burim të hapur me shpresën për të ndihmuar në ruajtjen e diversitetit gjuhësor të botës dhe për të lejuar përdoruesit të aksesojnë informacionin në gjuhën e tyre të preferuar për një përvojë më gjithëpërfshirëse me teknologjinë.
Sipas Metës, kjo teknologji mund të përdoret në çdo gjë, nga programet e realitetit virtual dhe të shtuar e deri te shërbimet e mesazheve, në mënyrë që të gjithë të kuptojnë dhe kuptohen. Kompania inkurajon hapur studiuesit që të ndërtojnë bazën e të dhënave të saj.
Gjetja e një mënyre për të regjistruar të dhënat audio për mijëra gjuhë në botë ishte sfida e parë e projektit, duke pasur parasysh se baza e të dhënave më e madhe ekzistuese e të folurit deri më tani ruante vetëm mbi 100 gjuhë.
Për të krijuar një sistem që mund të identifikonte 40 herë më shumë gjuhë të folura, ekipi vendosi t’u drejtohej teksteve fetare, si Bibla, të cilat janë përkthyer në shumë gjuhë dhe shpesh përdoren në kërkimin e përkthimit të gjuhës.
Duke përdorur regjistrime publike të këtyre teksteve të shenjta, Meta ka arritur të krijojë një bazë të dhënash të bazuar në Dhiatën e Re në më shumë se 1100 gjuhë. Me shtimin e regjistrimeve të tjera të pa etiketa, numri i gjuhëve të folura që MMS mund të njohë është rritur në më shumë se 4000.
Megjithëse shumica e regjistrimeve të përdorura u lexuan nga folësit meshkuj, analizat e mëparshme kanë treguar se sistemi njeh njësoj mirë zërat mashkullorë dhe femra.
Në të ardhmen, ekipi shpreson të zgjerojë më tej sferën e sistemit për të mbështetur edhe më shumë gjuhë, duke përfshirë dialekte specifike nga e gjithë bota, gjë që ka rezultuar prej kohësh sfiduese për teknologjinë ekzistuese të të folurit.