Hírek Alig 200 óra alatt tanítottak meg magyarul egy mesterséges rendszert

A modell ráadásul relatíve olcsó, kevesebb mint 1000 euróba került.

Nagyjából 15 millió ember beszéli a világ közel 7,7 milliárd lakosából a magyar nyelvet, amivel jelenleg a 78. helyen állunk a világ nyelvei között. Azt nézve nem is olyan rossz hír ez, hogy bár biztos számot nehéz mondani, még most is jóval 6 ezer felett van a beszélt nyelvek száma a Földön. Az viszont természetes vágy ilyen méretű beszédközösségnél, hogy szívesen használnánk anyanyelvünket az informatikai világban is. Ahhoz azonban sajnos a 15 millió beszélő kevés, hogy a nagy cégeknek megérje kifejleszteni a magyarul beszélő szoftvereket.

Most azonban a Pécsi Tudományegyetem (PTE) Alkalmazott Adattudományi és Mesterséges Intelligencia-csapata a Microsoft Azure mesterséges intelligencia és az ONNX Runtime megoldások alkalmazásával megépítette és betanította saját BERT-large modelljét magyar nyelven, méghozzá kevesebb, mint 200 munkaóra és 1000 euró befektetésével - adják hírül a Microsoft honlapján közzétett közleményükben.

A nagy mennyiségű magyar nyelvű adat kezelését megkönnyítendő a PTE természetes nyelvfeldolgozási (NLP) módszerek kutatásába fogott.

A megoldást egy magyar nyelvű BERT-large modell (HILBERT) létrehozása jelentette, ami egy nyílt forráskódú gépi tanulás keretrendszer. A modell célja, hogy segítse a számítógépet a többféleképpen értelmezhető szövegrészek megértésében oly módon, hogy a szövegkörnyezetből kontextust épít.
„A Microsoft piacvezető a nyelvi modellek betanításának területén. Természetes, hogy a legjobb technológiát akartuk használni” - mondta el Hajdu Róbert, az Alkalmazott Adattudományi és Mesterséges Intelligencia Központ volt tervezőmérnöke.

Ahelyett, hogy gyenge minőségű adatokat gyűjtöttek volna az internetről, a Nyelvtudományi Kutatóközpont szakemberei segítségével készítették elő az alapokat. Az Azure pedig mindent megkönnyített és felgyorsított.

200 munkaóra alatt végeztünk. Ez a világon az eddigi legolcsóbb BERT-large. Kevesebb, mint 1000 euróba került
- mesélte Dr. Feldmann Ádám, a PTE Adattudományi és AI csoport vezetője. „Az ONNX Runtime nélkül a HILBERT-large modellünk betanítása 1500 órát, vagyis megközelítőleg két hónapot vett volna igénybe” – tette hozzá.

A Pécsi Tudományegyetem BERT-large modellje jelentős lehetőségeket rejt magában az írott és beszélt szöveg feldolgozása, az intelligens keresés, az entitásérzékelés, a dokumentációs klasszifikáció terén. A HILBERT közreműködhet újabb, jobb teljesítményű chatbotok létrehozásában is.

azure_nyelvprogram-resized-970.jp2.jpg
 
Az álhir lehet fakenews de ugyan ugy lehet hoax is. Mégsem ugyan azt jelenti. Ebben az esetben ha magyarul akarjuk irni, mondani, már nem egy szóvqal, hanem megmagyarazva kell hasznalni.

A home office inkabb csak egy olyan kifejezés, ami elsősorban a virus kapcsán ment át a köztudatba.
Ha otthon dolgozom, otthoni munka van helyette használatban sokkal pontosabb és érthetőbb.

A classroom hasznalata marhaság, legfeljebb ha nagyképüsködik valaki akkor fogadhato el.
A story egy olyan nemzetkozileg elfogadott szó, amit minden nyelen megértenek!

A lockdown csak azért terjedt el mert sokan dolgoznak angliaban és utalva arra, hogy "én ott élek nem ugy mint Te" ezt hasznaljak, dfe ha van pontos magyar megfelelője(márpedig van) akkor miért ez?

Egyébként ez a tanarok felelősége is valahol!
Vitathato, hogy egy átlag ember a nyelv szavaibol mennyit hasznal aktivan. 2000? 2500?
Az árnyalatokat kifejező szavak sokszor pontatlanul vannak hasznalva! Ha valaki elkezdi a régies kifejezéseket mondani, akkor sokszor megnézik az emberek, hogy mi ez? Nagyképuskodik?
Iróink, költőink 15.000-20.000 szót is hasznaltak!
Ha valaki aktivan olvas, akkor kezdi az általuk használt szavakat a magáévá tenni, de egyébként azokat a szavakat szedi fel, amivel találkozik.

Emlitettem már a végletek :)
Ha valaki angol francia latin stb. kifejezést használ a pontosság kedvéért az érthető és elfogadhato.
Ha csak sznobzmusból, vagy divatból teszi az káros a nyelvre
Teljesen egyetértek az utolsó két bekezdéssel.

Azonban az angol, francia, latin kifejezéseket sem használja átgondoltan senki olyan környezetben, ahol nem értik.
Ez már a szaknyelv területe.

Ezért természetesen elfogadom egy informatikai programnál a deepspeed kifejezést.
Ha viszont nekünk írja, fordítania kell, mert nem értik/nem értjük.

Tehát az is fontos, kikből áll a hallgatóság.
De ebben, azt gondolom egyetértünk.

Én a köznyelvben elterjedő idegen szavak használata ellen lépek föl.
Ráadásul sokan nem értik, illetve nem jól használják.

Láttad már azt, hogy "Bacon szalonna"? Én már igen.
Az emberek többségének, úgy fest, fogalma nincs arról, hogy a bacon szalonnát jelent.

Az oktatás nagyon fontos. A nyelvhasználat szerintem az egyik csúcs, aminek a fejlesztésére sokkal több energiát kellene szánni.

39 évet töltöttem az oktatásban: akik nem beszélik jól a nyelvet, nem tudnak magas szinten írni, olvasni, azok számára előadhatod a fotoszintézis folyamatát.
Nem tudja követni, mert nem is érti. Így nem is építi be az ismereteibe.

(Egyébként a hoax szerintem nem álhír. Ahogyan írtad, inkább átverés, beugratás.
Az álhír kifejezetten hír. Más helyzetben használatos.
Úgy semmiképpen nem, hogy "fakenewsnak nem nyilatkozom".)
 
Utoljára módosítva:
(Egyébként a hoax szerintem nem álhír. Ahogyan írtad, inkább átverés, beugratás.
Az álhír kifejezetten hír. Más helyzetben használatos.
Úgy semmiképpen nem, hogy "fakenewsnak nem nyilatkozom".)
Pontoasan ezt akartam leirni!
A ketto nagyon nem ugyan az, de vighyazni kell az árnyalatokkal.
Sokan ezért használják az idegen nyelvi megfelelőjét szavaknak, hogy ne legyen szukseg magyarázkodásra, a hallgato pontosan ertse mirol beszélek!

Igy lehet a legoptimalisabban mégértetni a mondanivalonkat! (az optimalis annyit jelent, hogy a lehetőségek közül a lehető legjobb, ezért bántja a fulemet, mikor méág egyetemet vegzett, muveltz emberek is hasznaljak a legoptimalisabban kifejezést. A magyar nyelv elég furcsán viszonyul ehhez ha leforditjuk: leglegjobb :) )
 
A sok komolytalan hozzaszolas utan legyen végre valami komoly is!

Van egy kifejezés, a hunglish ami egy specialis nyelv. az angol nyelvteruleten élők beszélik.
Egy példa erre:
(en hulyere röhögtem rajta magam!)

 
Akkor újabb fordulóra hívlak Benneteket: tehát használjuk az álhír helyett azt, hogy fakenews?
Otthoni munka helyett a home office-t?
Classroomot az osztály/tanterem helyett?
Mondjunk study-t a tanulmány helyett?
Story legyen a történet, mese?
Beszéljünk angol lockdownról, lezárás helyett?

S hogy általános a világban?
Kb. 15 milliónyian beszéljük ezt a nyelvet.

Ez olyan sok, hogy nem kell vigyáznunk rá?
Nincs felelősségünk ebben?

Mit védtek ellenem?
Angol szavak túlzott és fölösleges használatát?
Az otthoni munka jó a home office helyett, tartalmilag és hangulatilag kifejezi mit jelent.
classroom használata idiotizmus, semmi plusszt nem jelent az eddig is létező magyar szavak helyett (a home office használata azért érthető valahol, mert egy korábban nálunk nem létező munkaformát írt le).
Study dettó, sem értelemben, hangulatban, jelentésben semmi egyébben nem hoz újat.
Story, hm, nehezebb eset, a mese semmiképp nem jó, a történethez közelebb áll, de az se adja vissza teljesen, mert nekem hangulatilag többletjelentést hordoz a sztori (ezt lehetne igy is irni, annyira elterjedt mára). Ez felveti azt is, a sztorin nem mindenki ugyanazt érti.
Lockdown is teljesen feleslegesen lett bevezetve, fiatal nagyképűsködő internetes "újságírók" vezették be ok nélkül, hacsak nem az az ok, hogy fitogtatni akarták fontosságukat/műveltségüket, vagy inkább azt, ők mennyire naprakészek ... Akár a lezárás, korlátozás egyenértékű lett volna vele.

Viszont vannak olyan szavak, amelyekre nincs tartalmilag/értelmileg/hangulatilag egyenértékű magyar megfelelő.
 
Akkor újabb fordulóra hívlak Benneteket: tehát használjuk az álhír helyett azt, hogy fakenews?
Használhatod a félrevezető hírt is, de ilyen hosszú szót ki fog leírni a "I u" korában...
Otthoni munka helyett a home office-t?
Classroomot az osztály/tanterem helyett?
Mondjunk study-t a tanulmány helyett?
Story legyen a történet, mese?
Az megvan, hogy nem egész 100 éve meg stúdiumot folytattak egyesek, mások meg históriákat meséltek?
Most "visszakopik" a nyelvbe.
Beszéljünk angol lockdownról, lezárás helyett?

S hogy általános a világban?
Kb. 15 milliónyian beszéljük ezt a nyelvet.

Ez olyan sok, hogy nem kell vigyáznunk rá?
Nincs felelősségünk ebben?
De igen és van.
Csak épp nem kizárva a globális ráhatásokat.
Sajnos tetszik vagy sem, a mai felgyorsult vilagban erteket vesztette a mives beszéd. És tartok tőle hogy egyhamar nem is nyeri vissza régi patináját.De "Lándzsarázó Vilmos" szavajárása is avittas manapság...
Mit védtek ellenem?
Angol szavak túlzott és fölösleges használatát?
Ki védi? Csupán, ha reálisan nézed, mindig volt idegen ráhatás. 30-60 évvel ezelőtt az orosz (szüleink vigan csasztuskáztak, mert már nem kellett tartani a zabrálástól), előtte a német (ezt talán nem is kell példával illusztralnom), annak előtte a francia, azt megelőzően meg a latin...
Beugrott a "Halotti beszéd".
Ŕeg olvastam, most előkerestem es megállapitottam, hogy még ukránul es szlovákul is jobban értek, mint ómagyarul.
Pedig ott jó, ha minden 4.-5. szót értek egy mondatból...
Én ezt ugy fogomfel, hogy a nyelv is fejlődik es a társadalmi változások kihatnak rá.
Vele tarthasz vagy kiléphetsz a fősodorból, de felő, hogy akkor nem csak a "Matisz papa félék", de masok sem fognak megérteni. A 6 éves (még nem iskolás) unokám úgy "szkájpol" és "meszendzserezik" nyelvtudas nelkül is, hogy a nejem írigykedve nézi.
 
Nem teljesen ugyanarról beszélünk.

A nyelv változik, ebben nincs vitánk.
Már az első hozzászólásnál is leírtam, hogy vannak nem helyettesíthető szavak, mert nincs magyar megfelelő, az idegen szót fogadtuk el, pl. online.

Így nem egy malomban őrlünk.

A fakenews, álhír, s nem kell félrevezetővel variálni, mert az álhír félrevezet. Azért, mert úgy, ahogy állítják, nem igaz.

S hogy értékét veszette a választékos beszéd?

Ebben egyeteértünk, s ezért írom sokadszor, ez óriási baj!
A nyelvünknek is, a társadalomnak is.
Írja helyettem Kodály:

1631040145501.png


"Ne abban lássuk a célt, hogy idegen kultúrákból mennél többet magunkévá tegyünk, hanem hogy a magunk jól megismert gyökereiből fejlesszük ki a magunk kultúráját." (Kodály)
 
A sok komolytalan hozzaszolas utan legyen végre valami komoly is!

Van egy kifejezés, a hunglish ami egy specialis nyelv. az angol nyelvteruleten élők beszélik.
Egy példa erre:
(en hulyere röhögtem rajta magam!)


Most tudtam megnézni a videót ... tényleg szenzációs ... you nem vagy agent, you vagy the csökkentagyú wolf .... eszméletlen ...
 
Utoljára módosítva:

Hírdetőink

kmtv.ca

kmtv.ca

Friss profil üzenetek

petrucy wrote on sizsu's profile.
Megtisztelve érzem magam a követés bejelölése miatt.-))
vorosmart wrote on bsilvi's profile.
Köszönömszépen a legújjab fordítást !
A "friss üzenetek + napok óta nem jelennek meg,hibát jelez
vorosmart wrote on DeeYoo's profile.
Köszönöm szépen a fordítást.

Statisztikák

Témák
38,094
Üzenet
4,794,584
Tagok
615,326
Legújabb tagunk
redbaron77
Oldal tetejére