09.07.10 Danas
Kutija sa blagom prvih vekova srpskog jezika
Kvantitativni opis strukture srpskog jezika - srpski jezik od XII do XVIII veka - Domentijan 1-3
Nedavno su izašla prva tri toma prvog kola Frekvencijskog rečnika - Kvantitativnog opisa strukture srpskog jezika, kao štampano i CD ROM izdanje, koje su objavili Službeni glasnik, Institut za eksperimentalnu fonetiku i patologiju govora i Laboratorija za eksperimentalnu psihologiju Filozofskog fakulteta Univerziteta u Beogradu.
Kako je prilikom predstavljanja prvih tomova Rečnika u Rektoratu Beogradskog univerziteta rekao direktor Glasnika, Slobodan Gavrilović, u pitanju je najveći poduhvat ovog izdavača za poslednje tri godine, delo koje je nakon nekoliko decenija ugledalo svetlost dana, a retke su kulture u svetu koje takvo delo imaju. Njegova elektronska varijanta, ocenio je Gavrilović, kada je pretraga u pitanju u samom je svetskom vrhu. Značaj ovog dela tek treba da oceni kulturna, naučna i književna javnost, dodao je on, ali da se radi o gorostasnoj zamisli nedvosmiselno je ako se ima u vidu da je Rečnik nastajao tako što je 16 pravougaonika na koje je taj bio podeljen papir A4 formata ručno ispunjeno rečju, pa i čitavom rečenicom i tako 11 miliona puta! Ovaj nesaglediv posao, kako je pojasnio urednik biblioteke Leksis u kojoj su objavljeni prvi tomovi Rečnika Milojko KneĐević, pokrenuo je 1957. godine lingvista, profesor Đorđe Kostić, vizionar i pionir u zamisli mašinskog i automatskog prevođenja teksta. U okviru projekta, koji je trajao pet-šest godina sa 400 saradnika, formiran je ručno anotirani dijahroni korpus srpskog jezika. Ova građa digatalizovana je, odnosno, uneta u računare, 1996. godine i iz te baze podataka štampane su prve tri knjige prvog kola koje su zapravo Frekvencijski rečnik Domentijanovih žitija svetoga Simeona i žitija Svetoga Save, koji je priredio dr Aleksandar Kostić, inače sin Đorđa Kostića.
Osim izvornih tekstova žitija, u Rečniku se nalaze popisane sve reči koje se u njima javljaju popisane redom, ali i njihova gramatička specifikacija, kao i sve oblici u kojima se u žitijima javljaju. Tako se dolazi do brojke od 78.284 reči u oba žitija, 4.606 odrednica i 15.783 gramatička oblika odrednica, kao i 927 gramatičkih oblika od 3.139 u sistemu gramatičkog kodiranja srpskoslovenskog jezika. Ovi, kao i svi ostali tomovi Rečnika u okviru segmenta od 12. do 18. veka, koji obuhvataju pola miliona reči, imaju značaj i zbog toga što će olakšati izučavanje najranijih faza srpskog jezika i jednog danas mrtvog jezika kakav je srpskoslovenski. U ovoj "kutiji sa blagom prvih vekova srpskog jezika", kako je rekao Knežević, dragocen alat naćiće ne samo lingvisti, naučnici koji se bave jezikom i književnošću, već i istoričari, istoričari umetnosti, arholozi i mnogi drugi.
Korpus srpskog jezika iz koga je uzimana građa za ovaj Rečnik, osim dela od 12. do 18. veka, podrazumeva i segment 18. i početka 19. veka, zatim sabrana dela Vuka Stefanovića Karadžića, pa drugu polovinu 19. veka i najzad savremeni srpski jezik uzet iz uzorka različitih funkcionalnih stilova - pozije, proze, literarnih, ali i naučnih i novinskih tekstova. Kada bude objavljen do kraja Rečnik će se sastojati od 30 tomova. Uskoro bi trebalo da izađu nova tri toma iz prvog kola u okviru segmenta od 12. do 18. veka, broj 4, 5 i 6, koji obuhvataju žitija Teodosija i Danila, najavljeno je iz Glasnika.
I. Matijević
04.06.10 Politika
Rečnik koji niko nema
„Kvantitativni opis strukture srpskog jezika”
Ako se otkriju razlozi dosadašnjih promena u jeziku, biće moguće predvideti kako će u budućnosti izgledati srpski jezik .
„Službeni glasnik”, zajedno sa Institutom za eksperimentalnu fonetiku i patologiju govora i Laboratorijom za eksperimentalnu psihologiju Filozofskog fakulteta u Beogradu, započeo je objavljivanje kapitalnog dela „Kvantitativni opis strukture srpskog jezika”, čiji je autor Đorđe Kostić (1909–1995), osnivač i dugogodišnji direktor Instituta za eksperimentalnu fonetiku i patologiju govora u Beogradu. Ovaj projekat izveden je iz „Korpusa srpskog jezika” koji je inicirao i osmislio Đorđe Kostić, a na ovom projektu, koji je trajao od 1957. do 1962. godine, bilo je angažovano oko 400 saradnika. Korpus se sastoji od jedanaest miliona reči, od kojih je svaka ručno gramatički obrađena, obuhvata srpski jezik od XII veka do savremenog jezika. U prvom segmentu edicije „Kvantitativni opis strukture srpskog jezika” obuhvaćen je srpski jezik od XII do XVIII veka, a upravo je objavljeno prvo kolo koje sadrži frekvencijski rečnik Domentijanovog „Žitija svetoga Simeona” i „Žitija svetoga Save”, u tri toma. Rečnik je priredio prof. Aleksandar Kostić, a stručni savetnik je prof. Đorđe Trifunović.
Iza ovih stručnih i pomalo komplikovanih naziva krije se jedinstven frekvencijski rečnik, kakav ne postoji ni za jedan od svetskih jezika. U „Žitiju svetoga Simeona” i „Žitiju svetoga Save”, svakoj reči je određen gramatički oblik i učestalost pojavljivanja. Prvi tom (900 strana) sadrži izvorni i gramatički obrađen tekst oba žitija. U drugom (1061) i trećem tomu (1143), dati su frekvencijski rečnici svakog od žitija i zbirni rečnik oba žitija, odnosno Frekvencijski rečnik Domentijana.
Na osnovu ovakvog rečnika, objašnjava prof. Kostić, mogu se porediti srpski jezik XII veka i savremeni srpski jezik, od nivoa leksike do nivoa gramatike. Tako, na primer, u jeziku XII veka dativ je bio izuzetno frekventan padež, dok je u savremenom srpskom jeziku on najmanje frekventan (oko dva odsto). Ukoliko bi se određenim statističkim postupcima definisale promene i one izrazile kao funkcije, u principu bi bilo moguće napraviti gruba predviđanja u kom pravcu će se srpski jezik menjati i kako će, na primer, izgledati kroz 400 godina.
Korpus srpskog jezika podeljen je na pet vremenskih perioda: srpski jezik od XII do XVIII veka, jezik XVIII veka, Sabrana dela Vuka St. Karadžića, jezik druge polovine XIX veka i savremeni srpski jezik. Uzorak srpskog jezika od XII do XVIII veka sastoji se od oko 500.000 reči i obuhvata najznačajnija dela srpskog srednjovekovnog pisanog nasleđa. Uzorak je podeljen u dva dela: prvi obuhvata dela Svetoga Save, Stefana Prvovenčanog, Domentijana, Teodosija, arhiepiskopa Danila, Grigorija Camblaka i patrijarha Pajsija, dok drugi deo čine: „Stare srpske povelje i pisma”, u izdanju Ljubomira Stojanovića. Sva dela gramatički su obrađena u celini.
Pedesetih godina prošlog veka radom na uzorku srpskog jezika od XII do XVIII veka, kao i radom na uzorku jezika XVIII veka, podseća Aleksandar Kostić, rukovodio je prof. Đorđe Sp. Radojičić, u ono vreme jedan od naših najvećih stručnjaka za staru srpsku književnost. Početkom 1996. godine, u saradnji Instituta za eksperimentalnu fonetiku i patologiju govora i Laboratorije za eksperimentalnu psihologiju Filozofskog fakulteta u Beogradu, počinje digitalizacija korpusa. Unos materijala koji se odnosi na srpski jezik od XII do XVIII veka započet je 2000. godine. Tada je formirana i manja ekipa stručnjaka za srpskoslovenski jezik pod stručnim nadzorom prof. Đorđa Trifunovića. Pripisivanje odrednica i korekturu gramatičke obrade Domentijanovih žitija uradila je dr Zorica Vitić.
Oba žitija, ističe prof. Kostić, sadrže 78.284 reči, 4.606 odrednica i 15.783 gramatička oblika odrednica. „Žitije svetoga Simeona” sastoji se od 26.572 reči, 2.852 odrednice i 7.923 oblika, dok „Žitije svetoga Save” sadrži 51.712 reči, 3.905 odrednica i 12.440 oblika. Od 3.139 gramatičkih oblika, koje sadrži sistem gramatičkog kodiranja srpskoslovenskog jezika, kod Domentijana se javljaju 972 oblika. Iz odnosa broja reči i broja odrednica u oba žitija može se zaključiti da je leksičko bogatstvo Domentijana izuzetno i da se može porediti sa leksičkim bogatstvom najznamenitijih savremenih autora.
Početkom 2002. godine započeta je digitalizacija celokupne objavljene srpske pisane baštine od XII do XVIII veka. U elektronskom obliku trebalo bi da se nađe preko dva miliona reči srpskoslovenskog jezika. Time bi bila postavljena osnova za izradu prvog srpskoslovensko-srpskog rečnika, a rad na njemu bio bi u velikoj meri olakšan postojanjem elektronskog korpusa. Rad na elektronskom korpusu srpskog pisanog nasleđa od XII do XVIII veka naišao je na razumevanje Ministarstva kulture Republike Srbije i Pokrajinskog sekretarijata za obrazovanje i kulturu koji su finansijski pomogli ovaj projekat.
Frekvencijski rečnik Domentijana i budući rečnici koji se odnose na srpski jezik između XII i XVIII veka, naglašava Aleksandar Kostić, rezultat su predanog rada velikog broja stručnjaka. Publikovanjem frekvencijskih rečnika i izvornog materijala, njihov rad postaje dostupan širem krugu istraživača iz različitih naučnih oblasti. Ukoliko bi ovaj projekat dodatno podstakao istraživanja srpskoslovenskog jezika i srpske kulturne istorije, njegova svrha bila bi ispunjena, a napori koji su u njega uloženi bili bi time višestruko nagrađeni.
U pripremi su tri nova toma: „Žitije svetoga Save” od Teodosija i „Životi kraljeva i arhiepiskopa srpskih” – arhiepiskopa Danila II u dva toma, koji bi trebalo da se pojave do predstojećeg Sajma knjiga u Beogradu. Čitav projekat trebalo bi da bude okončan do 2013. godine.
---------------------------------------
Predstavljanje u Kapetan-Mišinom zdanju
U Rektoratu Univerziteta u Beogradu (Kapetan-Mišino zdanje), danas u 13 časova, prva tri toma kapitalnog dela: „Kvantitativni opis strukture srpskog jezika”, predstaviće prof. Đorđe Trifunović i prof. Aleksandar Kostić.
---------------------------------------
Reči kod Domentijana
U Domentijanovim žitijima najčešće reči su: Hristos, kir Sava, Sveta gora, Jerusalim, David, Izrailj, kir Stefan, Pavle, Egipat..., a od imenica najčešće su: Bog, Gospod, otac, sveti duh, zemlja, Hristos, otačestvo, blagodet, molitva, čedo, ljubav, sila, dan, sin, vek, duša, srce...
Zoran Radisavljević