ugrás a tartalomhoz

Szemantikus web: kezdő kérdések

foxmulder · 2008. Szep. 8. (H), 01.14
Sziasztok! Kérlek, elmélkedjünk egy kicsit :)
Szóval azt értem, hogy egy rdf dokumentum kijelentéseket tesz egy bizonyos erőforrással kapcsolatban: alany - állítmány - tárgy. Vegyük a Szemantikus világháló elmélete és gyakorlata c. könyv egyik bevezető példáját, mely szerint a Magányos cédrus c. festményt Csontváry Kosztka Tivadar készítette (festette).

Sok más lehetőség mellett megadható, hogy Csontváry Kosztka Tivadar az Ember típus egy példánya, vagy az, hogy a készítette (festette) állítmány pontosan mit takar (lehet például a szerző-alkotó, vagy/és a képzőművészeti eljárások osztály (típus) alosztálya (altípusa)). Viszont a szemantikusság lényege sérül (szerintem), ha ezren ezerféleképpen határozzák meg (adnak meg hozzá URI-t és ott leírást, bár ez utóbbi elvileg tán nem is szükséges), mi az Ember és mi a készíteni (festeni) tulajdonság (állítmány) definíciója. Vannak-e olyan nyilvánosan hivatkozható fogalomtárak (vagy hogy nevezzem őket), ahol az ilyesféle alapfogalmak URI-ként hivatkozható formában, egységesen definiálva vannak?

Két lehetőséget látok: Vagy azért nem találom ezeket, mert béna vagyok, vagy mert a szemantikus web annyira kezdetleges állapotban van, hogy nincs még kialakult, egységes fogalomkészlete.

Mert megadhatom én a <pre>http://gipszjakab.hu/definiciok/alkalmazott</pre> oldalon (jesszusom, tényleg van gipszjakab.hu oldal!), hogy mit értek (én) az alkalmazott fogalom alatt, de ez a fogalom (fogalom és nem a szó!) van annyira elterjedt és nyelvfüggetlen, hogy szívesebben hagyatkoznék egy sztenderdizált meghatározásra ha lenne. Vagy vannak ilyenek?
És pár éven belül kialakul majd egy egységes fogalomtár, ami tartalmazza majd az ugyan különböző nyelveken kifejezett, de mégis azonos jelentésű típusokat (főnevek alkategóriákba szervezve, például a Festő egyben Ember is) és tulajdonságokat (igék), mondjuk azt a pár százat (vagy ezret), amit egy átlagos európai használ?

Bontsatok ki egy sört és írjatok valami okosat :)
 
1

Irreális

janoszen · 2008. Szep. 8. (H), 08.16
Amire Te vágysz, az egy tényleges világot leíró markup nyelv. Namost én ezt kb annyira érzem irreálisnak minthogy az előttem levő gép ma önállóan megcsinálja a munkámat. XML-lel, RDF-fel lehetne próbálkozni de a végén úgyis oda jutsz, hogy XSLT-vel letranszformálod az egészet hogy a böngésző meg tudja csámcsogni, Internet Explorer alatt is működjön, stb. Ergó, nem értél vele semmit, de szemantikus voltál.

A web alapvetően egy megjelenítési platform, ezért én úgy érzem, hogy a böngészőnek kiküldött adatoknak azt a célt kell szolgálniuk, hogy megjelenjenek a tartalmak, nem azt, hogy leírjon egy tökéletes adatszerkezetet. Nyilván, ha publikálni akarod valaki fele, akkor játszik az XML de akkor is inkább a feldolgozás egyszerűsége lesz a nyerő.

Kicsit hasonlít a szemantikus, mindent átölelő, tökéletes markup terve arra a megmozdulásomra, amikor a webes fájlok tárolására írtam SQL-ben egy komplett fájlrendszert Novell-like ACL jogosultságkezeléssel, tárolt eljárásokkal megcsinálva. Utólag kellemetlenül rá kellett ébrednem, hogy lehetetlen egy ennyire általános rendszert hatékonyan üzemeltetni, ugyanis állandóan minden modulnak baszakodni kell a jogosultságokkal, szopás a keresés benne és még emellett olyan szinten konfigurálhatóvá kell tenni, amennyire azt egy fájlrendszeren működő alkalmazástól elvárható.

Visszatérve, szerintem, egyelőre kár próbálkozni ilyesmivel. Illetve lehet, de minek. Használni nem tudja senki, központi szabvány az adatszerkezetekre nincs, a böngészők nem támogatják és úgyis csak a magunkfajta geekek tudják értékelni ha megnézik a forrást. Ha jól látom, akkor ez az egész a CSS hátszelével elkezdődött fejlődni de mivel az utóbbi időben nagyon keveset hallok róla, valószínűleg ez is egyike azoknak az ötleteknek, amik túl korán jöttek.

U.i. hajnali 00:14-kor nem sörözünk. Főleg gép előtt nem. XD
2

Két irány, két probléma

yaanno · 2008. Szep. 8. (H), 11.48
Az egyik probléma a frangmentáltság és az inkompatibilitás. A felülről építkező megközelítések (amiket te is említesz) számára vannak kész megoldások (FOAF, SPARQL stb), csakúgy mint az alulról építkezőkhöz is vannak próbálkozások (összefoglalóan ezeket most hadd nevezzem Mikroformátumoknak). Mindkét irány szerintem jó adag szemantikát visz be.

Bőséges mennyiségű top level adatbázis és sztenderd létezik - ontológiák, tezauruszok stb. Ezek összekötése az inkompatibilitás miatt egyelőre nincs meg. Technikai oldalról szerintem ez megvalósítható, éppen most olvastam egy postot egy SUN-os fickó blogján, aki a fragmentált social netwörköket próbálja összekötögetni úgy, hogy egyszerűen elosztott rendszerként veszi őket (előkeresem majd az írást).

A fő gond, hogy ezek a felső szintű rendszerek fogalmilag inkompatibilisek. Egy példa. A mostani Webkonfon volt egy előadás a szemantikus webről és a magyar köztezauruszról, ami egy igencsak hatalmas munka volt nyelvészek, informatikusok és filozófusok részvételével. Az előadásból az egyértelműen lejött, hogy egy általános tezaurusz azért nem lehetséges, mert a magyar nyelv olyan, amilyen - és minden nyelv olyan, amilyen; a relációk, kifejezések hihetetlen sokrétűsége és diverzitása miatt egy általános tezaurusz (és ontológia) szükségképpen vérszegény lenne. (A webconf anyagait érdemes megnézni a témában.)

Ennek ellenére volt erre is kísérlet az USA-ban (Buffalo Egyetem), ahol egy általános célú ontológiát képzeltek el, és olyan fogalmakkal kezdték, mint esemény, okság, tárgy stb. Nem tudom, hol tart a dolog, vagy hogy eljutottak-e valahová.

A Mikroformátumok esetén a dolog egyszerűbbnek tűnik, ez egyfajta népi szemantika, így nem túl egzakt és általános, ám az erejét éppen abból nyeri, hogy releváns kapcsolatokat azonnal és egyszerűen létre tud hozni bárki, a visszakeresés szintén egyszerű.

Szerintem mindkét iránynak van jövője, csak míg az előbbi tudás- és erőforrásintenzív (ebből következően "nem népszerű"), utóbbi nehezen sztenderdizálható, fragemntált (ebből következően "nem veszik komolyan").

Végül egy hazai link, itt is érdemes körülnézni.