“Улым, һиңә әйтәм...”30.12.2016
“Улым, һиңә әйтәм...” Сентябрь аҙағында Удмурт Республикаһының баш ҡалаһында үткән Вики-Урал семинарында ҡатнашҡанда Мари Иленән килгән математик-лингвист һәм программист Андрей Чемышевтың сығышын минең ҡатын-ҡыҙ аҡылы бер нисек тә башыма һыйҙыра алмағайны: бер йыл эсендә “Яндекс.Тәрже­мәсе”не нисек итеп мариса “һөйләшергә” өйрәтергә мөмкин булмаҡ кәрәк инде... Әммә Андрей Валерьевич ярты юлда туҡтала торған кеше түгеллеген эше менән раҫлап ҡына ҡалмай, ә “Яндекс.Тәржемәсе”не башҡортса аңларға мәжбүр итеү юлында этәргес көс булып торҙо һәм әле лә шулай. Бөгөнгө әңгәмә уның ошо йүнәлештәге эшмәкәрлеге һәм, әлбиттә, мариҙар өлгөһөндә башҡорт теленең киләсәге хаҡында.
– Андрей Валерьевич, сентябрҙә мари теле “Яндекс.Тәржемәсе”гә индерелде һәм бөгөн мариса айырым һүҙҙәрҙе, һөйләмдәрҙе донъяның 85 теленә һәм киреһенсә тәржемә итергә мөмкин. Ни өсөн телде үҫтереүҙе тап мәғлүмәт технологиялары аша алып барыу үҙенә ылыҡтырҙы һәм был йүнәлештә эшмәкәрлегегеҙҙе ҡасан башланығыҙ?
– 2011 йылда Йошкар-Олала төрлө илдәрҙең компьютер лингвистарын йыйып, конференция үткәрҙек һәм шунда теләһә ниндәй тел электрон мәғлүмәт ҡырында йәшәһен өсөн биш шарт үтәлергә тейешлеген асыҡланыҡ. Улар барлыҡ телдәр өсөн дә бер үк. Беренсеһе – шрифт һәм клавиатура бүленеше; икенсеһе – барыһы ла ҡуллана алған электрон һүҙлектәр; өсөнсөһө – ошо телдә дөрөҫ яҙыуҙы тикшереү системаһы; дүртенсеһе – машина тәржемәсеһе; бишенсеһе – ошо телдә эҙләү системаһы.
Тотоп торған ошо биш бағана нигеҙендә системалы эш алып барыла. Ни өсөн “Яндекс.Тәржемәсе”не һайланыҡ, сөнки ул – Рәсәй компанияһы, уның аша ваҡытты күпкә тиҙләттек, йәғни сентябрь башында машина тәржемәсеһенең бета-версияһы әҙер ине инде.
Әлеге ваҡытта башҡарылмаған пункт булып эҙләү системаһын эшләү мәсьәләһе тора. Ул – бер ни тиклем ҡатмарлы процесс, сөнки Яндекс йәки Гуглдағы һымаҡ эшләге килмәй. Уларҙың эш принцибы нисек: бары тик һүҙҙәр генә эҙләнә. “Яндекс.Тәржемәсе” идиомаларҙы, ҡушма ҡылымдарҙы танымай һәм беҙ, нимә етмәгәнен асыҡлап, ошо етешһеҙлекте, ике телле корпусты тулыландырабыҙ һәм йыл аҙағына тиклем финал релизына етергә тип уйлайбыҙ.
– “Яндекс.Тәржемәсе”не мари теленә өйрәтеүҙә лингвистар ғына ҡатнашамы, әллә был теләгән бер кешенең ҡулынан килә торған эшме?
– Ярҙам итергә теләүселәр булһа, баш тартмайбыҙ, әлбиттә. Әгәр кемдер тәржемәнең етешһеҙлеген йәки хатаһын күрә икән, ул уны төҙәтә ала. Телде белеүселәр күберәк ҡатнашҡан һайын, файҙаға ғына. Ләкин һәр кем файҙа ғына эшләмәй шул, зыян килтергәндәр ҙә бар, улар булмаһын өсөн модераторҙар тикшереп, күҙәтеп тора.
– “Яндекс.Тәржемәсе”не эшкә “егер­гә” теләүегеҙҙең төп маҡсаты нимәлә?
– Мари телен һаҡлап ҡалыу. Әгәр ул Интернетта, компьютерҙа, электрон мәғлүмәт ҡырында йәшәһә – үлмәйәсәк, башҡа телдәр тарафынан ҡыҫырыҡлап сығарылмаясаҡ, лингвистик оккупацияға дусар ителмәйәсәк. Үҙегеҙ уйлап ҡарағыҙ, хәҙер балалар 4-5 йәштә Интернет гиҙә. Әгәр унда үҙенең туған телен күрмәһә, тапмаһа, уның күңелендә тел тураһында кире фекер ҡаласаҡ, ул хатта Интернетта ла юҡ, тип уйлаясаҡ һәм икенсе һөйләштәргә күсәсәк. Шулай яйлап тел бөтәсәк.
– Яндекста тағы ниндәй яңы телдәр үҙенә “йәшәү хоҡуғы” даулай?
– Күптән түгел генә яңы – попьяменто-криоль теле индерелде. Был телдә 329 мең самаһы кеше һөйләшә.
– Киләсәккә ниндәй пландар ҡора­һығыҙ?
– Киләһе йылдан мари теле корпусын төҙөү хыялы бар. Ул ниндәйҙер ваҡыт арауығында, мәҫәлән, 150 йылда донъя күргән барлыҡ баҫма продукция – китаптар, гәзит-журналдар һ.б. тексы базаһы. Унда һәр һүҙ айырым тег менән билдәләнә. Шулай уҡ киләсәктә корпустың бер өлөшөнә синтаксик тамға эшләү хыялы ла бар. Бындай синтаксик тамға корпусы донъяла ни бары ун ғына. Был ни өсөн кәрәк: телдә бик күп нәмәләр анализланмаған. Лингвистар, филологтар быны эшләп өлгөрмәй, сөнки бөтөн нәмәне ҡулдан эшләп ултырырға, китапханаларҙан яҙып алырға кәрәк. Ә мари теле корпусы булһа, кеше көн дауамында теләһә ниндәй фәнни әҫәрҙе анализлай алыр ине.
– Әлеге ваҡытта мари телендә лә, башҡорт телендә лә машина тәржемә­сеһенең бета-версиялары эшләй, әммә улар камиллыҡтан бик алыҫ...
– Бында иң ауыр эш – параллель корпус­тар базаһын йыйыу. Беҙ әле лә параллель текстар йыйыу менән шөғөлләнәбеҙ. Башҡорттар ҙа был эшкә тотондо. Беҙ тиҙҙән терәк морфемалары һүҙлеген эшләй башлаясаҡбыҙ. Был инде һүҙҙе тулыһынса тикшереү мөмкинлеген бирәсәк, һәр һүҙгә аңлатма буласаҡ. Мәҫәлән, аш-һыуға ҡағылышлы һүҙҙәр, транспорт тураһында һәм башҡалар. Был үҙенә күрә лингвистик антология буласаҡ. Артабан был параллель текстарҙы башҡа изге эштәр өсөн дә файҙаланырға мөмкин. Мәҫәлән, параллель электрон китаптар, уларҙың аудио-варианттары...
– Һеҙҙең эшмәкәрлек өлгөһөн һәм әйтеп үткән системаны башҡа телдәргә лә күсерергә мөмкин. Әлеге ваҡытта башҡорт Википедияһы ирекмәндәре һәм башҡа телһөйәрҙәр “Яндекс.Тәржемәсе” өсөн башҡортса параллель текстар туп­лау менән шөғөлләнә. Ни өсөн башҡорт коллега­ларығыҙ был йәһәттән һәл­кәүлек күрһәтә икән?
– Мин башҡорт коллегаларым менән даими бәйләнештәмен. 3-4 декабрҙә бергә сара үткәрергә планлаштырғайныҡ, әммә килеп сыҡманы. Дөрөҫөн әйткәндә, Рәсәй Фәндәр академияһы Өфө ғилми үҙәгендәге Тарих, тел һәм әҙәбиәт институтының өлкән ғилми хеҙмәткәре, филология фәндәре кандидаты Зиннур Сиражетдиновта кәрәк булған бөтөн база бар, ләкин башҡорттарҙа һүлпәнлек, төшөнкөлөк тойола. Әлбиттә, ирекмәндәрҙең был эшкә тотоноуы яҡшы, ләкин һәр саҡ уларҙың көсөн файҙаланыу ҙа этика нормаларына һыйып бөтмәй бит.
– Ғөмүмән, ошо эште нисә кеше һәм күпме ваҡытта атҡарып сыға ала?
– Даими ошоноң менән генә шөғөлләнгәндә, өс лингвист етә. Элек Зиннур Әмир улының лабораторияһында өс хеҙмәткәр бар ине, хәҙер эшләйҙәрме, юҡмы, белмәйем. Бына уларға ҡушҡанда, бер йылда йырып сығырға була.
– Ә ирекмәндәр көсө менән йырып сығырға мөмкинме?
– Әлбиттә, ләкин был – дәүләт кимәлендә хәл ителә торған эш...
– Мари Илендә был эш дәүләт контролендәме?
– Мари телен “Яндекс.Тәржемәсе”гә индереү мәсьәләһе менән Республика мари мәҙәниәте үҙәгендә быйыл йәй ойошторолған Мари телен һәм мәҙәниәтен инновациялы үҫтереү бүлеге, йәғни беҙ шөғөлләнәбеҙ. Яндексҡа ун томлыҡ “Мари теле һүҙлеге”нең электрон версияһынан файҙаланыу хоҡуғы бирелде.
...Әлбиттә, Андрей Чемышев менән оҙон-оҙаҡ әңгәмәләшергә мөмкин, әммә уның тел төбөндәге “улым, һиңә әйтәм, киленем, һин тыңла” тигән ишара аңлашылалыр, моғайын...


Вернуться назад