A web 2 üzleti fenntarthatósága és civilizációs mellékhatásai
Hogyan változott meg az internet a tömegek megjelenésével
■ H | K | Sze | Cs | P | Szo | V |
---|---|---|---|---|---|---|
24 | 25 | 26 | 27 | 28 | 1 | 2 |
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 | 1 | 2 | 3 | 4 | 5 | 6 |
Végre szántam rá időt, hogy
A szerző nem fukarkodik a becsmérlő szavakkal, amikor az iskolázatlan, buta netezők tömegeit ostorozza, ő maga azonban úgy ír magyarul, mintha a Google fordítóval fordította volna a cikkét kínaiból.
Személyes tapasztalat hiányában a cikk első felét elfogadtam, mint tényt, viszont amikor a szerző a "Szűklátókörű, ostoba és átgondolatlan az a vélemény..." kezdetű mondattól azt kezdi ostorozni, hogy mennyire_de_nem_lehet Facebook nélkül élni, mert különben elhidegülünk azoktól a "barátainktól", akiknek a gyermekáldásáról azért nem értesülünk, mert nem vagyunk fönt a FB-on... Itt feladtam.
Lehet, hogy éppen az ilyen blogmotorokon futó, a "cikkhez" hasonló "trash content"-ek miatt (hogy a szerzőt idézzem) ilyen silány a web, mint amilyen?!
Absztrakció
Én is hasonlóan jártam.
Én szántam rá néhány percet
Az általánosítás sosem jó. (
Akkor hogy gondolod?
Könnyebb ma megtalálni az
Kb ugyanannyi erőfeszítés, mint régen volt, és ugyanolyan hülyék a keresők ma is kontextus kezelésben, egy-két kivételtől eltekintve, mint pl "időjárás", stb... Egyéb kérdés? :D
Igen?
A fő gond velük, hogy nem
Könnyebb ma megtalálni az
A szubjektív tapasztalatom az, hogy manapság könnyebben megatalálom azt, amit éppen keresek. Régebben túrni kellett a többedik eredményoldalt is, akár egy releváns találatért is; mostanában elenyésző az ilyen, sokszor még görgetnem sem kell. Ugyanúgy csökkentek az olyan esetek száma is, amikor egyáltalán nem találok megfelelő találatot. Akár azért, mert nincs is annyi eredmény, vagy mert feladom 10+ oldalnyi "találat" után.
Persze az is lehet, hogy "primitív" dolgokra keresek, megtanultam, hogy hogyan keressek, megtanultam nem keresni olyan dolgokra, amikre úgysincs válasz, vagy éppen csak nem várok olyan választ, mintha egy mindentudó M.I. válaszolna emberi nyelven. De a felhasználói élményem összességében javult a keresést illetően.
Ezen felül jelentős javulásra nem számítok, amíg nem lehetséges a természetes nyelvek automatizált, gyors és pontos értelmezése, feldolgozása. És ha ez már elérhető is lesz, az "értékes tartalom" fogalma továbbra is szubjektív marad, ami újabb érdekes problémákat vet fel már ma is.
"értékes tartalom" =
Nem feltétlenül
Nem feltétlenül zár burokba,
Abban igazad van, hogy egy ilyen szűrés torzíthatja a fent említett index-et, mert a felhasználó nem tud róla, hogy hiányos információt kapott, és egy csomó mindent elrejt előle a keresőmotor, ami egyébként érdekelné.
Már rég benne vagyunk abban a
Hány (angol nyelvű)oldal létezhet a neten?
Ebből mennyit találnak meg a keresők?
És mennyi a valóban releváns találat, ha nem pornót keresel?
Vajon miért?
Nekem még rémlik, hogy a keresők hajnalán, ugyan jóval kevesebb oldal volt, a keresőktől akkor még viszonylag használható találatok jöttek. Aztán a google indulásával... (nem kizárólag a Google-t okolom, de velük kezdődött a keresők használhatatlanná válása)
Max. annyi van, hogy nem a személyes profilod zár burokba, hanem a találatnak látszó hirdetèsek és a SEO.
Pontosan
A Google dolgozik valamilyen mesterséges intelligencián, de sajnos a többieknek erre nincs erőforrásuk, azaz teljesen kiszolgáltatottak leszünk egy cégnek, ami eddig sem a korrektségéről volt híres.
A keresők nem a HTML miatt
A gépek a buták, ezért kell
Az emberek buták, ezért a
Az emberek még mindig jóval
Az emberek még mindig jóval
Az okosságban és a hatékonyságban én nem lennék olyan biztos. Tudok olyan munkáról, ahol magyarul írt szöveghez kell rövidebb összefoglalót írni megadott kulcsszavakkal, és az olcsó munkások sokszor katasztrofálisan végzik el, pedig csak az anyanyelvükön való kommunikáció lenne a feladatuk. Így viszont már az olcsóság sem annyira játszik, mert amit általa nyerünk a réven, elvesztjük a hatékonyság, minőség vámján. Az ilyen idegölő, unalmas, monoton munkát senki nem fogja huzamosabb ideig olcsón végezni; szerintem még drágán se túl sokáig.
Egyébként szerinted az olcsó emberi munkásokat nem profitorientált cég fogja fizetni?
A fejlesztők, ha rájönnek,
És a fejlesztőnek mi köze a
Kellene de nem lehet rávenni.
Nos igen. De mit várunk az emberektől, ha a szövegszerkesztőket, táblázat kezelőket sem tudják használni. Nem érdekli őket hogy hogyan lehet (hosszútávon) hatékonyan szerkeszteni, csak úgy nézzen ki ahogy ő elképzelte (lásd szóközös igazítás).
Tartalmat is csak akkor címkéznek, ha valamilyen hasznuk van belőle. Csak azért hogy valid legyen? Nem fizeti meg senki akkor minek?
A rossz tapasztalataim miatt
Ideális esetben azokat
Ugyanakkor gondolom vannak fizikai korlátai, hogy mennyi oldalról lehet kellő részletességű indexet létrehozni, tárolni, frissíteni, azaz karbantartani (meg persze pénzügyi korlátai, hogy a lehetségesből mennyit érdemes ténylegesen megvalósítani, hogy fenntartható legyen az "üzlet").
De tegyük fel, hogy adott keresésre az összes létező, releváns oldalt elő tudjuk keresni. Hogyan prezentálod ezeket a keresést indító felhasználónak, hogy mindegyikről tudomást szerezzen, és ne neki kelljen végigbogarászni az adott esetben több tíz- vagy százezres listát azért, hogy eldöntse, melyik a legjobban passzoló találat?
[off]
Valóban az a tapasztalatod, hogy pornóra "értékesebb" találatokat adnak a keresők? :D
[/off]
De tegyük fel, hogy adott
A találatok már megvannak, a
De ha még lehet is tovább szűrni (és legyen ideális az eset, az összes szűrési lehetőség után csak egy találat marad), ismét felteszem a kérdést: hogyan és ki fog minden adatot konzisztensen és hatékonyan megjelölni? Hogyan fogsz hatékonyan és praktikusan megjelöl(tet)ni folyószövegben található adatokat? Valamint hogyan és ki fog úgy keresni, hogy arra a kereső algoritmus kezelhető mennyiségű találatot adjon?
Mint ahogy Kossuth Lajosról
Ahogy most is van rá ajánlás, hogyan jelöljük a markupban tag-ekkel a dokumentum részeit, ugyanilyen módszerrel lehet leírni a világ objektumait.
Ezekhez kell egy nagy, nyílt ajánlás, ahol az objektumok és a köztük lévő összefüggések megvannak. Ilyenje van a Google-nek, de nem véletlenül nem osztja meg senkivel.
Mint ahogy Kossuth Lajosról
Mint például? És mi alapján döntjük el, hogy milyen és mennyi kapcsolódó dolog jelenik meg oldalt? Mi van, ha engem nem ez a Kossuth Lajos érdekel, hanem aki a több százezredik találatban szerepel?
Azt eddig is értettem, hogy valamilyen módon naprakészen akarod tagelni a teljes lehetséges emberi tudásbázist, csak azt fedi mindig balladai homály, hogy ez hogyan kivitelezhető praktikusan (és objektíven, minden részletre kitérően), akár a kereső szolgáltató, akár minden egyes tartalomgyártó oldalán egy ekkora adathalmazt belátható időn belül kezelni tudó általános M.I. nélkül (amire gyanítom, hogy "pár" évet még várnunk kell).
Nagyon előreszaladsz, az
Ezt továbbra is értem. Azt
A webfejlesztők, de első
Lehet kezdeni a munkát!
A folyószöveget már most is
És ez a pár kulcsszó mennyiben ad teljes képet egy blogbejegyzésről? Máshol pont az ilyen kulcsszavas keresésről folyik a panaszkodás.
Hozzáállás
Tudom, hogy a probléma összetett, de lehet vele úgy foglalkozni, hogy gyerünk, csináljuk, és legfeljebb nem sikerül, akkor majd módosítunk rajta. De az nem tetszik, ahogy a kifogásokat keresed, hogy valamit miért nehéz megcsinálni. Igen, nehéz. Na, és akkor mi van? Akkor inkább felejtsük el? Oldja meg más helyettünk?
A mesterséges intelligencia egyébként kikerülhetetlen a témában, csak nem mindegy, mikor és hol vonjuk be. A sokak által szentnek tartott Google gőzerővel fejleszti, csak éppen úgy, hogy senki másnak nem lesz hozzáférése, így gyakorlatilag mindenkit kizárnak. Ez nekik jó, mindenki más meg rosszul jár, mert mindenki úgy fog táncolni, ahogy ők fütyülnek.
Ha szemantikusan lennének felcímkézve a webes adatok, akkor lehetősége lenne bármelyik cégnek specializált keresőt írni. Például az ingatlan.com-on megjelenhetne Magyarország összes ingatlanja, vagy az árukeresőn az összes termék. Gondolj bele, mennyi időt lehetne ezzel spórolnia mindenkinek!
Akkor kicsit félreértesz. Én
A témaspecifikus keresők is jók, csak azokat is valakinek karban kellene tartania, illetve mindenkinek egy adott rendszert kellene használnia valamilyen megegyezés alapján. Például mindenféle címkézés nélkül, ha mindenki az ingatlan.com-on hirdetné az ingatlanát, ugyanoda jutnánk el, és mennyi időt spórolnánk meg, mert nem kell még egy rendszert kialakítani, megtanulni, megtanítani, feldolgozni! Ez a valamiben megegyezés inkáb civilizációs probléma, vagy az emberi természeté, aminek a megoldásában szintén szívesen részt vennék.
Szóval nem kifogásokat keresek, hanem válaszokat, iránymutatást, hogy ez a címkézős dolog hogyan kivitelezhető praktikus módon.
A "megfogható" objektumokat
Egyelőre megelégednék ennyivel, ez nem nagy kihívás. A folyószövegek már valószínűleg inkább az MI hatáskörébe tartoznak, és egyelőre nem kéne foglalkozni vele.
Javaslom elolvasni a következő blogmark konklúzióját, a macskás képig bezárólag. A mesterséges intelligencia a második választás, én inkább az elsőt javasolnám, mert azzal a többség, az a pár milliárd ember jobban jár.
Elméletben statisztikai
Elméletben statisztikai
Egy bizonyos pontosságig igen. Csak ez olyan nyelvek feldolgozásánál elég alacsony lehet, ahol egy máshol szereplő vessző, eltérő szórend, stb. meglehetősen más jelentést is eredményezhet. És azért van "pár" természetes nyelv, amire ez igaz. Sajnos a természetes nyelvek értelmezése nem triviális programozási feladat (különben már minden tolmácsot leváltott volna a google fordító :) ).
Szerintem ez nem nyújtana jelentős javulást a jelenlegi keresési helyzetnek (azt sem tartom kizártnak, hogy a google ilyen jellegű algoritmusokat (is) használ). Persze nem vagyok számítógépes/elméleti nyelvész, csak érdeklődő, így könnyen lehet, hogy nagyot tévedek.
Szerintem mindketten laikusok
Hát van egy ideje ún.
ki fogja a címkézést
Szvsz. ezeknek a kritériumoknak a nagy részére nincs szükség. Elég ha automatizáltan csak nagyjából valamit összegányol a gép. A maradékon lehet dolgozni, hogy pontosítsuk, kijavítsuk a hibákat. Ha erre a debuggolásra fellőnének valamilyen GUI-t, hogy emberek is tudják csinálni, akkor a gyakran keresett tartalmak pár év alatt használható szintűek lennének, lásd wikipedia. A tudást igénylő tartalmak javítása nyilván sokkal több időt venne igénybe. Pl most legutóbb a béta bomlást néztem wikipedian, és hibásak az egyenletek, amiket írnak. http://physics.stackexchange.com/questions/228929/beta-decay-of-radiocarbon De találkoztam már régebben is komoly tárgyi tévedéssel.
Segítsetek keresni!
Hogy lehet egy ilyet megtalálni?
Mert rengeteg találat, ami "teljesnek" hazudja magát, közben én többről tudok, mint ami ezekben összesen szerepel.
Holott ezeknek kellene, hogy legyen valami nyilvántartásuk, nem?
(google maps meg egyenesen szánalmas e tekintetben)
Miért van szükséged erre a
Mert a macskámnak gyógytáp
Egyébként csak példa volt, hogy még ilyen jellegű infókat is alig vagy egyáltalán nem lehet kipréselni a keresőkből. Vagy próbálj megkeresni bármilyen árukörhöz kapcsolódó egyéb boltokat, pláne ha nincs webáruházuk! Hihetetlen, hogy 2016-ban még itt tartunk. Szóval volna létjogosultsága Gábor elképzelésének...
Ha nincs
Ha van, aki publikál ilyen listát/listákat és a kereső ezt meg is találja, akkor az már megint nem feltétlenül a kereső hibája, hogy a lista nem teljes, hanem vagy az illetőnek kellene a teljességre törekednie, vagy az adott "üzletnek" felkeresnie a lista szerzőjét, hogy ő is hadd szerepeljen rajta.
Egyébként a budapesti állatpatika első találatán van egy ilyen szöveg:
Igaz, hogy elvileg a legutóbbi frissítés 2014 vége, de aki mondjuk szeretné, hogy megtalálják, az lobbizhatna itt.
Továbbra is azon a véleményen vagyok, hogy ha egyetlen darab szövegdoboztól elvárjuk, hogy választ adjon tetszőleges kérdésünkre, akkor meg kell várnunk az általános M.I. elkészültét; ha meg témaspecifikus dolog érdekel, akkor termeljük/termeltessük ki az ahhoz szükséges szakmédiumot.
Releváns találat... Nálam az
Nálam az első oldalon, a 6-7-8. találatok így néznek ki:
Konkrétan nincs, de vannak
Nekem tök releváns
Van néhány releváns találat.
Ez már kifejezetten humor kategória. Fapados fedélzetén a keresőkifejezés.
Érdemes megnézni, milyen képeket talál erre a google :D
Arra sem képes, hogy a mobilom két böngészőjében egyforma találatokat adjon és ahogy elnézem, ami utastérről készített kép megjelenik, az sem fapadosé... khm... finoman szólva :)
Hogy lehet, hogy a google
Átülsz másik gépre, másik ISP-t (mobilszolgáltató) használsz és 30-80%-ban eltérő találatokat kapsz. Akkor is, ha előzőleg minden cookie-t és hasonló szemetet töröltél mindkét böngészőből.
Vagy: miért nem lehetett legalább opcióként meghagyni, hogy _pontos_ kifejezésre keressen a user? Hiába idézőjelezel, az írásjeleket talán az ékezeteket is, totálisan figyelmen kívül hagyja.
A probléma ott van, hogyha