ugrás a tartalomhoz

The Internet is for Porn

Hidvégi Gábor · 2011. Aug. 27. (Szo), 21.24
Már laikusok is szembesülnek a web technológiai korlátaival
 
1

A web mely technológiai

Joó Ádám · 2011. Aug. 27. (Szo), 21.20
A web mely technológiai korlátjának áttörése segítené elő, hogy a Google kitalálja, a szerző hogyan szereti az uborkasalátát?
2

Ki más küldte volna be? :)

bugadani · 2011. Aug. 27. (Szo), 21.43
Ki más küldte volna be? :) Félre ne érts, ahányszor elolvasom egy hozzászólásodat a témáról, mindig egy fokkal közelebb jutok ahhoz, hogy egyetértsek veled, mindenesetre egyedi fogalmazási stílusod kicsikart belőlem egy mosolyt.
Az Indexen azóta megjelent egy cikk arról, hogy a Google hogy alakítja át az emberiség memóriáját, most hirtelen nem találom, de rákeresek ( :) ) Itten vagyon: Ez abból a szempontból jó, hogy az agy megtanul szelektíven tárolni "kereshető" adatokat, abból a szempontból viszont nem jó, hogy a mostani weben messze nem minden olyan könnyen kereshető, lásd uborkasaláta. (Na jó, ez így nem teljesen igaz, én elég könnyen ráleltem a sima uborkasaláta receptjére, persze ahány ízlés, annyi recept, mindenesetre kénytelen vagyok egyetérteni anarki és Gábor véleményével.)
3

Ostoba, buta cikk

rszaloki · 2011. Aug. 27. (Szo), 21.44
Ez egy ostoba, buta cikk, amiben a szerző fogalom nélkül vagdalkozik. Egy dologra volt jó, hogy bemutassa, mire jó az internet. Napokon belül jelentek meg egyszerű uborkasaláta receptek (pl: http://malackaraj.blog.hu/2011/07/22/az_interneten_most_mar_nem_csak_porno_van ). Elindult a beszélgetés, a kommunikáció.
4

Bár rszalokinak igaza van,

Hidvégi Gábor · 2011. Aug. 28. (V), 09.09
Bár rszalokinak igaza van, valóban bután és primitíven írta meg a szerző a cikket, és valószínűleg fizikailag képtelenség technológiailag olyat megvalósítani, ami kielégíthet egy indexes újságírót : ), de pár lényeges dologra azért rátapintott.

Az egyik: a keresők jelenleg nem mások, mint egyszerű automaták, amelyek nem képesek többre, mint "felolvasni" azt, amit korábban láttak.

Emellett arra is jogosan mutat rá, hogy a PageRank algoritmus titkossága miatt nem tudjuk megmondani, milyen módon áll össze egy találati lista, azaz nem ismerjük és nem ismerhetjük az általunk létrehozott értékét.
A PageRank-nek van egy olyan szorzója is, amely a ránk mutató oldalak PageRank-je alapján rangsorol minket (az minél magasabb, annál jobb helyezésünk lesz nekünk is), ami kétélű fegyver, és a "kétmilliárd légy nem tévedhet" elve miatt nem biztos, hogy a legjobb értékmérő.

A fentiekből következik, hogy annál kisebb eséllyel kapunk jó találatokat, minél összetettebb dologra keresünk. Ha meg szeretnénk találni valamit, rendesen igénybe kell vennünk a fejünket, azaz a siker intelligenciafüggő. Tovább nehezíti a helyzetet, hogy nap mint nap millió új tartalom kerül fel az internetre, ami lehetetlenné teszi az emberi feldolgozást. Szerintem sokat mondok, ha az átlag számára az elérhető információk egy század százaléka érhető el az interneten.

Jóval egyszerűbb lenne a helyzet, ha az agymunkát rábíznánk a gépekre, azaz közvetetten a mesterséges intelligencia fejlesztőire, de ehhez előbb három dolgot kell megvalósítanunk:

1, létrehozni egy szabályrendszert, amivel definiáljuk a világ objektumait és a köztük lévő összefüggéseket, például ezt a hozzászólást, engem, és azt, hogy én írtam.
Fontos, hogy meghatározzuk ezen adatok feldolgozásának módját, hogy transzparens legyen, és mindenki, aki webes tartalom létrehozásával foglalkozik, pontos információkkal rendelkezzen arról, hogy mit csinál (agyő, titkos PageRank).

Ezzel kapcsolatban a legfontosabb, hogy nyílt és független szervezet hozza létre a szabályokat, és a központi adatbázis is nonprofit szervezet kezében legyen, hogy minél jobban elkerülhessük a visszaéléseket.

2, a gépi feldolgozás megsegítéséhez át kell állni az adat alapú weboldalak létrehozására. Itt szerintem nem jó megoldás az, amit ajánlanak (pl. a schema.org), hogy a meglevő HTML-t dekoráljuk szemantikus elemekkel, hanem eleve objektumokat kéne létrehozni (például <recept> objektum, benne <osszetevok>), mert így sokkal élesebb a technológiai váltás érzete (bár hozzá kell tenni, hogy a folyószövegekben továbbra is dekorálni kell).

Mindez megvalósítható egy kis akarással, valamint az XML technológia segítségével. Az XML-nek több előnye van, ami miatt ésszerű választás: az adatokat stíluslapok (XSL) segítségével bármilyen más formátumú adattá lehet transzformálni, például HTML-lé, így emberi fogyasztásra ugyanúgy alkalmasak lesznek. A HTML tehát megmaradhatna, de egyrészt jóval egyszerűbb formában, másrészt csak egy láncszem lenne (mint mondjuk a CSS), de nem a legfontosabb. Az XML mellett szól még, hogy mind a backenden, mind frontenden nagyon nagy a támogatottsága.

3, támogatni kell az adatok metainformációkkal való ellátását mind a tartalom szerzőjénél, mind pedig a fogyasztóknál. Ez utóbbi nem csak azt jelenti, hogy értékelhessék a látogatók, hogy mennyire hasznos, hanem arra is, hogy címkékkel is elláthassák.

Ha ezek a feltételek teljesülnek, akkor gépileg el lehet kezdeni a legjobb uborkasaláta receptjének keresését. Úgy gondolom, hogy amikor ez megvan, bekerülhetne egy Wikipédia-szerű adatbázisba, és ugyanolyan szócikk lehetne, mint pl. a gepárd. Meg elsőre értelmes találatokat kapnánk arra, hogy "suzuki swift 1.3 teljesítményadatok", vagy "hidvégi gábor hozzászólásai szemantikus web témakörben".

Fontos még megemlítenem a mi felelősségünket, azaz a webszerkesztőkét. Amíg többségünk nem ismeri fel a váltás szükségességét, és továbbra is csak <header>-ben és <article>-ben gondolkozik, addig nem lesz előrelépés. Rá kell bírnunk magunkat és a független döntéshozókat (pl. a W3C-t, Mozillát), hogy váltsanak szemléletet.

A schema.org jó kezdeményezés lehetne, ha nem profitorientált cégek lennének mögötte, mint a Google, vagy a Microsoft. Hasonló úton lehetne elindulni, de függetlenül.
9

Már siránkoztam egy sort a

H.Z. v2 · 2011. Aug. 29. (H), 09.41
Már siránkoztam egy sort a saját topikomban: próbálj a gúglin valami árunak is minősülő dologról érdemi információkat találni, mellőzve a marketing szemetet!
Esélytelen. Akkor épp laptopot kerestem és úgy próbáltam, hogy a keresett gép típusát plusz jellel, a marketingre utaló szavakat mínusszal írtam a keresőkifejezésbe.
Ennek ellenére kizárólag webshopok jöttek elő... kész, feladtam! :D
5

Tökéletesen rossz példa

alippai · 2011. Aug. 29. (H), 00.02
Tzatziki uborkasaláta

A Google kevés mindent tud úgy keresni, mint receptet. Ennél többet nem kérhet senki sem - emberek által osztályozva, összetevők, elkészítés módja/hossza, tápérték szerint szűrhetően kínálja fel. Ezek után egy szakácskönyv vagy egy ember sem tud többet segíteni. Innentől a dolgot úgyhívják, hogy művészet.
6

A link eredménye: Your search

bugadani · 2011. Aug. 29. (H), 08.24
A link eredménye: Your search - tzatziki - could not be completed with the requested search options. Reset search tools
Nekem ebből nem úgy tűnik, hogy tud keresni :)
7

Érdekes, nálam megy

alippai · 2011. Aug. 29. (H), 09.26
Ettől függetlenül egy ételnévre rákeresve nálam baloldalt megjelenik a Recipes kategória (ahol a hírek, videók, képek és bevásárlás is). Vagy ez csak az én gépem egyedi featureje? Lehet országra van korlátozva vagy ilyesmi? (Szlovákiából nyitom meg a google.com-ot)
8

Hm. Már nem is tudom, hány

H.Z. v2 · 2011. Aug. 29. (H), 09.38
Hm. Már nem is tudom, hány alkalommal jártam úgy, hogy párom megkért, keressem meg valaminek "a receptjét". És még mindig nem szokta meg, hogy ilyen egyszerűen nem létezik. A legegyszerűbbnek tűnő ételre/sütire is legalább ötvenféle variáns jön elő...
10

Használd ki.

Joó Ádám · 2011. Aug. 29. (H), 13.09
Használd ki.
11

Elég gyakran futok bele abba,

ensomhet · 2011. Aug. 29. (H), 15.19
Elég gyakran futok bele abba, hogy a neten minden fenn van, mindent meg lehet találni, kivéve azt, amit éppen keresek és valóban hasznos információ lenne, legyen szó akár egész hétköznapi dolgokról is. Vagy csak nagyon bénán keresek. (Legutóbbi eredménytelen keresésem pl. a non-stop valutaváltó Budapesten.)