sākums

2010. gada 30. aprīlis

kaut kas par semantisko tīklu un Web 3.0

Nenoliedzami, ka ar google palīdzību globālajā tīmeklī var atrast gandrīz jebkādu meklēto informāciju. Tomēr, neskatoties uz to, bieži vien ir jāvelta ilgs laiks, lai sameklētu tieši to, kas mani interesē.
Piemēram, ja man būtu nepieciešamas uzzināt 10 lielākās valstis, kurās ir sieviete prezidente... Šāda informācija glabājas kaut vai wikipēdijā. Tur ir informācija par valstīm, par to platību, valdību utt. , kā arī, šī informācija tiek regulāri un operatīvi atjaunota. Tomēr, lai no turienes izdabūtu man nepieciešamo informāciju, man pašai nāktos skatīt cauri n-tās lapas un meklēt, kurās valstīs ir sieviete prezidente, cik lielas ir šīs valsis un tad atlasīt 10 lielākās. Tas noteikti aizņemtu diezgan daudz laika. Negribu pat izmēģināt, cik daudz.
Tā ir galvenā globālā tīmekļa problēma – tur ir daudz un dažāda informācija, bet tomēr atlasīt no tās tieši to, ko man vajag, nav nemaz tik ātri un vienkārši. Bez tam, ne vienmēr es zinu, ko man vajag un kas man varētu noderēt no tīmeklī esošās informācijas.
Tāpēc ir labi, ka ir cilvēki, kas strādā pie tā, lai būtu lielāka jēga no visas tās milzīgās informācijas gūzmas, kas tīmeklī pa šiem aptuveni 20 gadiem ir uzkrājusies un arvien tiek ražota klāt.
Neiedziļināšos tehniskajās detaļās, lai gan tas ir gana interesanti, vien īsumā minēšu galvenos atslēgvārdus šīs tēmas sakarā un galveno būtību.

„Jēgas radīšana” no globālajā tīmeklī pieejamajiem „labumiem” tiek panākta izmantojot semantiskā tīkla tehnoloģijas, kas attiecas uz, tā saukto, Web 3.0 ēru. Ja Web 2.0 ir galvenokārt saistīts ar cilvēku savstarpējo komunikāciju (blogi, twiteri, draugiem.lv, youtube utt.), tad Web 3.0 ir saistīts ar webisko datorsistēmu savstarpējo komunikāciju. Ar semantiskā tīkla tehnoloģiju palīdzību tiek panākts, ka datorsistēmas (web aplikācijas) saprot viena otru un komunicē viena ar otru.

Semantiskā tīkla pamatā ir ontoloģijas. Ontoloģija savukārt ir jēdzienu sistēma – jēdzieni un saites starp tiem. Šāda jēdzienu sistēmas izmantošana ļauj datorprogrammām „saprast” informācijas jēgu jeb semantiku. Un ja dažādas datorsistēmas izmanto vienu un to pašu jēdzienu sistēmu, tad šīs datorsistēmas var „saprast” viena otru.
Piemēram, runājot par Latviju, atkarībā no konteksta datorsistēma „saprastu” vai ar to ir domāta valsts Latvija, viesnīca „Latvija” vai varbūt mikroautobuss „Latvija”. Vai runājot par „briedi” saprastu, vai runa ir par briedi mežā vai personu ar uzvārdu Briedis.
Šis risinājums uzlabo arī dabīgās valodas apstrādi, ļaujot lietotājiem meklēt tīmeklī ne tikai pēc atslēgas vārdiem, bet arī pēc konkrēta interesējošā jautājuma. Kaut vai to pašu – kuras ir 10 lielākās valstis, kurās ir sieviete prezidente. Šobrīd, ja mēs meklētājā ievadām tādu jautājumu, mums tiek izdota atbilde balstoties uz atslēgvārdiem, nevis pēc būtības.
Ontoloģiju definēšanai tiek izmantota noteikta valoda, līdzīgi kā ir html – informācijas attēlošanai pārlūkprogrammā, vai XML – informācijas strukturēšanai. Viena no šādām valodām jeb standartiem, kas šobrīd jau tiek diezgan plaši izmantota, ir RDFa.
Google meklētājs arī jau šobrīd ir diezgan gudrs un saprot dažus jēdzienus. Piemēram, tas saprot, ko nozīmē vārds „travel” (pamēģini, redzēsi, ko tas nozīmē). Citas lietas, ko Google „saprot” labi aprakstītas te http://www.mapelli.info/tips/ultimate-google-search-tips-guide
 
Ar semantiskā tīkla palīdzību dators ne tikai labāk saprot, ko mēs vēlamies atrast, bet arī piedāvā mums automātiski saturu, kas mums varētu būt noderīgs. Šis saturs tiek iegūts no dažādām sistēmām.
Piemēram, students, apskatot universitātes mājas lapā savu lekciju sarakstu, var ar viena klikšķa palīdzību, vai automātiski – pēc noteiktiem uzstādījumiem, ievietot lekciju sarakstu savā google (vai citā web bāzētā) kalendārā; viņam automātiski tiek piegādāta papildus informācija par noteiktu mācību priekšmetu – piemēram, praktisko darbu izpildes termiņi. Ja vēl klāt ir informācija par prognozēto laika apjomu darba izpildes, tad sistēma var automātiski aprēķināt, cik reāli studentam tos ir izpildīt termiņā, un pie kalendārā ierakstītās ballītes ceturtdienas vakarā, pievienot brīdinājuma ziņu, ka uz ballīti labāk gan neiet, bet ķerties pie darbu izpildes.
Nu kaut kā tā. Tas nedaudz fantāzijai. Bet kaut kas no šī jau ir pavisam reāls un pieejams.
Nedaudz papētīju, kas konkrēti semantiskā tīkla lietas labad ir izdarīts un pieejams parastam lietotājam un kā tas tiek panākts.

Es apskatīju divus risinājumus: Headup un Zemanta.

Par Zemantu biju dzirdējusi jau pasen. Toreiz gan neizmēģināju, kā tā darbojas, tāpēc nevaru novērtēt uzlabojumus pēdējo gadu laikā. Gan Headup, gan Zemanta ir satura piegādāšanas/ieteikšanas sistēmas.
Zemantu galvenokārt izmanto blogeri. Tā analizē tekstu, kas tiek rakstīts blogā un automātiski piedāvā saistītos/līdzīgos rakstus, bildes, saites, tagus. Tas ir īpaši noderīgi tieši automātiskai saišu ģenerēšanai. Piemēram, lai noteiktiem vārdiem automātiski saliktu saites uz wikipediju.

Headup ir līdzīga tehnoloģija – tā arī automātiski piedāvā saturu. Var, piemēram, savā mājas lapā pievienot vienu rindiņu headup koda.
[script src="http://mint1.headup.com/clientscripts/annotate.js?customerid=dcdace" type="text/javascript"]
[/script]
Tad mājas lapai atveroties, headup analizē lapas saturu, pasvītro atpazītos vārdus, saģenerē papildus informāciju par šiem vārdiem un attēlo ērtā veidā.
(Šis kods ir ielikts arī šajā blogā, tāpēc, iespējams, pamanīsiet vai jau pamanījāt sarkani punktoti svītrotus vārdus un headup darbībā.) 
Headup pieejams arī kā Firefox Add-ons, bet tam man nepatika informācijas attēlojums. Tas nelikās tik glīts un ērts kā webā implementētajā fīčā. Bet funkcionalitātes ziņā tāpat ir noderīgs, jo man pašai nav jāmeklē atsevišķi informācija wikipēdijā, attēlos, youtūbē, kā to parasti daru par interesējošu vārdu, bet šis saturs no šīm lapām tiek man automātiski piegādāts.

Jāatzīst gan, ka šīs tehnoloģijas normāli darbojas tikai ar angļu valodas tekstiem. Vismaz headup veido savu ontoloģiju tikai ar angliskajiem jēdzieniem.
LU ir grupa, kas strādā pie latviešu semantiskā tīkla izstrādes un attīstības. Cerams, ka arī viņi kaut kad nāks klajā ar līdzvērtīgiem risinājumiem.

Tas bija tāds īss ieskats manā izpratnē un pārdomās par semantisko tīklu.

Papildus informācijai, jauks video par šo tēmu



Un cita papildus informācija

Latviešu valoda semantiskajā tīmeklī (SemTi-Kamols)
http://www.semti-kamols.lv/doc_upl/SemTi-Kamols_final.pdf

Vienkāršots izskaidrojums par semantisko tīklu



RDFa
http://rdfa.info/about/



Headup tehnoloģija
http://headup.com/technology.php

0 koment�ri:

Ierakstīt komentāru