ugrás a tartalomhoz

A web 2 üzleti fenntarthatósága és civilizációs mellékhatásai

Hidvégi Gábor · 2015. Dec. 22. (K), 07.15
Hogyan változott meg az internet a tömegek megjelenésével
 
1

Végre szántam rá időt, hogy

tisch.david · 2016. Jan. 4. (H), 10.00
Végre szántam rá időt, hogy elolvassam... Kár volt, bár csak a feléig bírtam cérnával.

A szerző nem fukarkodik a becsmérlő szavakkal, amikor az iskolázatlan, buta netezők tömegeit ostorozza, ő maga azonban úgy ír magyarul, mintha a Google fordítóval fordította volna a cikkét kínaiból.

Személyes tapasztalat hiányában a cikk első felét elfogadtam, mint tényt, viszont amikor a szerző a "Szűklátókörű, ostoba és átgondolatlan az a vélemény..." kezdetű mondattól azt kezdi ostorozni, hogy mennyire_de_nem_lehet Facebook nélkül élni, mert különben elhidegülünk azoktól a "barátainktól", akiknek a gyermekáldásáról azért nem értesülünk, mert nem vagyunk fönt a FB-on... Itt feladtam.

Lehet, hogy éppen az ilyen blogmotorokon futó, a "cikkhez" hasonló "trash content"-ek miatt (hogy a szerzőt idézzem) ilyen silány a web, mint amilyen?!
2

Absztrakció

Hidvégi Gábor · 2016. Jan. 4. (H), 11.53
Absztrakció
3

Én is hasonlóan jártam.

Endyl · 2016. Jan. 4. (H), 12.14
Én is hasonlóan jártam. Ha egy 3500 plusz szavas "cikk" feléig nem találkozok érdemi mondanivalóval (sőt, inkább csak az ellenkezőjével), akkor az bizony a "cikkben" annyira lelkesen szidott "trash content" kategóriába kerül, és nem pocsékolok rá több időt.
4

Én szántam rá néhány percet

virág · 2016. Jan. 4. (H), 15.12
Én is szántam rá néhány percet kávé mellett és elolvastam, nem nevezném "trash content"-nek, annak ellenére, hogy nem értek egyet a szerzővel. Ez egy tipikusan a "régen minden job volt" életérzés motiválta kirohanás, amit a szerző a cikk elején megpróbált konszolidálni némi tényszerű információval. Azonban amikor valaki homogén tömeget csinál egy ezernyi árnyalattal bíró dologból - ez szinte mindig rosszul sül el, itt is ez történt. A tények és felsorolások után egy szubjektiv zagyvaságot kapunk, ahol általános érvényű igazságok próbálnak megfogalmazódni. Arra azonban jó volt a szöveg, hogy az ember elgondolkodjon afelett, hogy miért nem szabad egy bonyolult dologról egyszerüen (helyesebben szólva: negativ értelemben leegyszerüsitetetten) gondolkodni. És ez itt most nem egy burkolt fikázás, hanem tényleg igy gondolom.
5

Az általánosítás sosem jó. (

inf3rno · 2016. Jan. 10. (V), 05.35
Az általánosítás sosem jó. ( :D :D :D )
6

Akkor hogy gondolod?

Hidvégi Gábor · 2016. Jan. 10. (V), 21.45
Miért, nincs igaza? Könnyebb ma megtalálni az értékes tartalmat? Nem veszik el a zajban? A keresők annyival hatékonyabbak lettek?
7

Könnyebb ma megtalálni az

inf3rno · 2016. Jan. 11. (H), 05.43
Könnyebb ma megtalálni az értékes tartalmat?


Kb ugyanannyi erőfeszítés, mint régen volt, és ugyanolyan hülyék a keresők ma is kontextus kezelésben, egy-két kivételtől eltekintve, mint pl "időjárás", stb... Egyéb kérdés? :D
8

Igen?

Hidvégi Gábor · 2016. Jan. 11. (H), 10.32
2004 és 2014 között hússzorosára nőtt a website-ok száma. Ha igaz az, hogy a keresők nem javultak számottevően, akkor nem hiszem, hogy ugyanannyi erőfeszítés lenne.
10

A fő gond velük, hogy nem

inf3rno · 2016. Jan. 11. (H), 13.44
A fő gond velük, hogy nem értik, hogy milyen kontextusban használok egy-egy szót, és tök más találatokat adnak ki. A másik gond, hogy sokszor én sem tudom a szakszavakat, és próbálom elmagyarázni órákon át a gépnek, hogy mit akarok, mire kidob egy cikket, amiből meg tudom tanulni a témához kapcsolódó szakszavakat. 2004-ben is ugyanezzel küzdöttem. Nem látok nagy különbséget. Olyan jellegű oldalakból, aminél ez a probléma előkerül nem hiszem, hogy sokkal több lenne, nem az a tutorial meg blog kategória.
9

Könnyebb ma megtalálni az

Endyl · 2016. Jan. 11. (H), 10.47
Könnyebb ma megtalálni az értékes tartalmat? Nem veszik el a zajban? A keresők annyival hatékonyabbak lettek?

A szubjektív tapasztalatom az, hogy manapság könnyebben megatalálom azt, amit éppen keresek. Régebben túrni kellett a többedik eredményoldalt is, akár egy releváns találatért is; mostanában elenyésző az ilyen, sokszor még görgetnem sem kell. Ugyanúgy csökkentek az olyan esetek száma is, amikor egyáltalán nem találok megfelelő találatot. Akár azért, mert nincs is annyi eredmény, vagy mert feladom 10+ oldalnyi "találat" után.

Persze az is lehet, hogy "primitív" dolgokra keresek, megtanultam, hogy hogyan keressek, megtanultam nem keresni olyan dolgokra, amikre úgysincs válasz, vagy éppen csak nem várok olyan választ, mintha egy mindentudó M.I. válaszolna emberi nyelven. De a felhasználói élményem összességében javult a keresést illetően.

Ezen felül jelentős javulásra nem számítok, amíg nem lehetséges a természetes nyelvek automatizált, gyors és pontos értelmezése, feldolgozása. És ha ez már elérhető is lesz, az "értékes tartalom" fogalma továbbra is szubjektív marad, ami újabb érdekes problémákat vet fel már ma is.
11

"értékes tartalom" =

inf3rno · 2016. Jan. 11. (H), 13.45
"értékes tartalom" = megtaláltam, amit kerestem. Ez azért elég jól mérhető egy elégedettségi index-el vagy hasonlóval.
12

Nem feltétlenül

Endyl · 2016. Jan. 11. (H), 14.45
Nem feltétlenül jó, ha mindig pont azt kapom, amit kerestem.
13

Nem feltétlenül zár burokba,

inf3rno · 2016. Jan. 11. (H), 15.43
Nem feltétlenül zár burokba, ha azt kapod, amit kerestél. Ha egy adott témakörben keresek releváns cikkeket, abban lehet ezer különböző vélemény is. Ha hibás a keresőmotor, akkor ezeket tévesen szűri az előéletem alapján, de ez már nem az én problémám, és egyébként sem szabadna nyomon követnie a keresőnek... ;-)

Abban igazad van, hogy egy ilyen szűrés torzíthatja a fent említett index-et, mert a felhasználó nem tud róla, hogy hiányos információt kapott, és egy csomó mindent elrejt előle a keresőmotor, ami egyébként érdekelné.
14

Már rég benne vagyunk abban a

Há.Zé. · 2016. Jan. 12. (K), 08.41
Már rég benne vagyunk abban a burokban.
Hány (angol nyelvű)oldal létezhet a neten?
Ebből mennyit találnak meg a keresők?
És mennyi a valóban releváns találat, ha nem pornót keresel?
Vajon miért?
Nekem még rémlik, hogy a keresők hajnalán, ugyan jóval kevesebb oldal volt, a keresőktől akkor még viszonylag használható találatok jöttek. Aztán a google indulásával... (nem kizárólag a Google-t okolom, de velük kezdődött a keresők használhatatlanná válása)
Max. annyi van, hogy nem a személyes profilod zár burokba, hanem a találatnak látszó hirdetèsek és a SEO.
15

Pontosan

Hidvégi Gábor · 2016. Jan. 12. (K), 10.09
Nehezít a dolgon, hogy a fejlesztők lustasága és ostobasága miatt a csillogó HTML irányába mentünk el, és nem a szemantikus web felé, így jóideig esély sincs arra, hogy a keresők jobban értsék, mit is szeretnénk.

A Google dolgozik valamilyen mesterséges intelligencián, de sajnos a többieknek erre nincs erőforrásuk, azaz teljesen kiszolgáltatottak leszünk egy cégnek, ami eddig sem a korrektségéről volt híres.
19

A keresők nem a HTML miatt

Endyl · 2016. Jan. 12. (K), 13.01
A keresők nem a HTML miatt nem értik jobban, hogy mit szeretnénk, hanem mert nem (vagy legalábbis meglehetősen korlátozottan) beszélnek emberi nyelveken, és mert algoritmusok vannak mögöttük, nem pedig egy általános intelligencia. Akik keresnek, azok meg nem beszélnek a gép nyelvén. Valakit meg kell tanítani a másik nyelvére.
21

A gépek a buták, ezért kell

Hidvégi Gábor · 2016. Jan. 12. (K), 13.08
A gépek a buták, ezért kell nekünk alkalmazkodni, a HTML is erre egy kísérlet, csak tovább kéne már lépni.
24

Az emberek buták, ezért a

Endyl · 2016. Jan. 12. (K), 13.21
Az emberek buták, ezért a gépeknek kell alkalmazkodniuk; a HTML is erre egy kísérlet, csak tovább kéne már lépni (az általános M.I. felé).
25

Az emberek még mindig jóval

Hidvégi Gábor · 2016. Jan. 12. (K), 13.31
Az emberek még mindig jóval okosabbak, mint a gépek, ráadásul hatékonyabb és olcsóbb velük elvégeztetni az adatok megjelölését, mint ugyanezt a munkát mesterséges intelligenciára és profitorientált cégre bízni.
28

Az emberek még mindig jóval

Endyl · 2016. Jan. 12. (K), 14.22
Az emberek még mindig jóval okosabbak, mint a gépek, ráadásul hatékonyabb és olcsóbb velük elvégeztetni az adatok megjelölését, [...]

Az okosságban és a hatékonyságban én nem lennék olyan biztos. Tudok olyan munkáról, ahol magyarul írt szöveghez kell rövidebb összefoglalót írni megadott kulcsszavakkal, és az olcsó munkások sokszor katasztrofálisan végzik el, pedig csak az anyanyelvükön való kommunikáció lenne a feladatuk. Így viszont már az olcsóság sem annyira játszik, mert amit általa nyerünk a réven, elvesztjük a hatékonyság, minőség vámján. Az ilyen idegölő, unalmas, monoton munkát senki nem fogja huzamosabb ideig olcsón végezni; szerintem még drágán se túl sokáig.

Egyébként szerinted az olcsó emberi munkásokat nem profitorientált cég fogja fizetni?
31

A fejlesztők, ha rájönnek,

Hidvégi Gábor · 2016. Jan. 12. (K), 14.50
A fejlesztők, ha rájönnek, mit nyerhetnek vele, önként és dalolva fogják megjelölni a tartalmakat, lásd a HTML 5 bevezetésével mindenki elkezdte használni az új tag-eket.
32

És a fejlesztőnek mi köze a

Endyl · 2016. Jan. 12. (K), 15.05
És a fejlesztőnek mi köze a tartalom címkézéséhez? A fejlesztő legfeljebb eszközt biztosít, hogy a tartalomgyártó címkézhesse. A tartalomgyártónak viszont meg kellene tanulnia használni az eszközt. Sokuknak viszont ennél sokkal egyszerűbb feladatokkal is meggyűlik a bajuk.
41

Kellene de nem lehet rávenni.

sly · 2016. Jan. 12. (K), 17.46
A tartalomgyártónak viszont meg kellene tanulnia használni az eszközt.


Nos igen. De mit várunk az emberektől, ha a szövegszerkesztőket, táblázat kezelőket sem tudják használni. Nem érdekli őket hogy hogyan lehet (hosszútávon) hatékonyan szerkeszteni, csak úgy nézzen ki ahogy ő elképzelte (lásd szóközös igazítás).

Tartalmat is csak akkor címkéznek, ha valamilyen hasznuk van belőle. Csak azért hogy valid legyen? Nem fizeti meg senki akkor minek?
49

A rossz tapasztalataim miatt

Endyl · 2016. Jan. 13. (Sze), 12.44
A rossz tapasztalataim miatt én nem attól tartok, hogy legalább hébe-hóba ne csinálnák a címkézést (bár az is probléma, ha alig csinálják), mert abból elvileg hasznuk származna, ha jobban kereshetőek. Nekem az általános, automatizálhatón túlmenő címkézés minőségével kapcsolatban vannak fenntartásaim, amikor sokaknak egy A/B választás is nehezen megy ("Ha azt akarom, hogy 'A' történjen, akkor 'A'-t vagy 'B'-t válasszam? ...").
16

Ideális esetben azokat

Endyl · 2016. Jan. 12. (K), 11.49
Ideális esetben azokat megtalálják, amik valamilyen módon csatlakoznak a már feltérképezett oldalakhoz, vagy ha még létezik ez az opció, akkor ha "regisztrálják" őket a keresőbe (persze ha nincs rámutató link, akkor nem lesz túl impozáns a helyezése).

Ugyanakkor gondolom vannak fizikai korlátai, hogy mennyi oldalról lehet kellő részletességű indexet létrehozni, tárolni, frissíteni, azaz karbantartani (meg persze pénzügyi korlátai, hogy a lehetségesből mennyit érdemes ténylegesen megvalósítani, hogy fenntartható legyen az "üzlet").

De tegyük fel, hogy adott keresésre az összes létező, releváns oldalt elő tudjuk keresni. Hogyan prezentálod ezeket a keresést indító felhasználónak, hogy mindegyikről tudomást szerezzen, és ne neki kelljen végigbogarászni az adott esetben több tíz- vagy százezres listát azért, hogy eldöntse, melyik a legjobban passzoló találat?

[off]
Valóban az a tapasztalatod, hogy pornóra "értékesebb" találatokat adnak a keresők? :D
[/off]
17

De tegyük fel, hogy adott

Hidvégi Gábor · 2016. Jan. 12. (K), 12.07
De tegyük fel, hogy adott keresésre az összes létező, releváns oldalt elő tudjuk keresni. Hogyan prezentálod ezeket a keresést indító felhasználónak, hogy mindegyikről tudomást szerezzen, és ne neki kelljen végigbogarászni az adott esetben több tíz- vagy százezres listát azért, hogy eldöntse, melyik a legjobban passzoló találat?
A kulcsszó: szemantikus web. Meg kell minden adatot jelölni, és akkor nagyon szépen lehet szűrni a találatokat.
18

A találatok már megvannak, a

Endyl · 2016. Jan. 12. (K), 12.39
A találatok már megvannak, a felhasználónak nincs további tudomása esetleges további szűrési lehetőségről, mert beírta a keresőmezőbe a pontos "kérdését" (pl.: how to make a win 10 system as secure as possible; a google erre elvileg 105,000,000 találatot dob, de legyen ennek csak 0.1 vagy 0.01%-a valóban releváns); hogyan prezentálsz nem triviális mennyiségű találatot?

De ha még lehet is tovább szűrni (és legyen ideális az eset, az összes szűrési lehetőség után csak egy találat marad), ismét felteszem a kérdést: hogyan és ki fog minden adatot konzisztensen és hatékonyan megjelölni? Hogyan fogsz hatékonyan és praktikusan megjelöl(tet)ni folyószövegben található adatokat? Valamint hogyan és ki fog úgy keresni, hogy arra a kereső algoritmus kezelhető mennyiségű találatot adjon?
20

Mint ahogy Kossuth Lajosról

Hidvégi Gábor · 2016. Jan. 12. (K), 13.07
Mint ahogy Kossuth Lajosról is megjelenik a keresőben egy rakat plusz információ a jobb oldalon, ugyanígy lehet a fenti kérdésnél is kapcsolódó dolgokat megjeleníteni.

Ahogy most is van rá ajánlás, hogyan jelöljük a markupban tag-ekkel a dokumentum részeit, ugyanilyen módszerrel lehet leírni a világ objektumait.

Ezekhez kell egy nagy, nyílt ajánlás, ahol az objektumok és a köztük lévő összefüggések megvannak. Ilyenje van a Google-nek, de nem véletlenül nem osztja meg senkivel.
22

Mint ahogy Kossuth Lajosról

Endyl · 2016. Jan. 12. (K), 13.19
Mint ahogy Kossuth Lajosról is megjelenik a keresőben egy rakat plusz információ a jobb oldalon, ugyanígy lehet a fenti kérdésnél is kapcsolódó dolgokat megjeleníteni.

Mint például? És mi alapján döntjük el, hogy milyen és mennyi kapcsolódó dolog jelenik meg oldalt? Mi van, ha engem nem ez a Kossuth Lajos érdekel, hanem aki a több százezredik találatban szerepel?

Azt eddig is értettem, hogy valamilyen módon naprakészen akarod tagelni a teljes lehetséges emberi tudásbázist, csak azt fedi mindig balladai homály, hogy ez hogyan kivitelezhető praktikusan (és objektíven, minden részletre kitérően), akár a kereső szolgáltató, akár minden egyes tartalomgyártó oldalán egy ekkora adathalmazt belátható időn belül kezelni tudó általános M.I. nélkül (amire gyanítom, hogy "pár" évet még várnunk kell).
26

Nagyon előreszaladsz, az

Hidvégi Gábor · 2016. Jan. 12. (K), 13.33
Nagyon előreszaladsz, az összefüggések kezelése egy sokadik lépés a jelenleg szükségestől. A schema.orgon már elkezdtek pár objektumot leírni, ezt a munkát kéne folytatni.
29

Ezt továbbra is értem. Azt

Endyl · 2016. Jan. 12. (K), 14.34
Ezt továbbra is értem. Azt áruld el, ki fogja a címkézést elvégezni hatékonyan, konzisztensen, pontosan, minden lényeges részletre/szempontra kitérően, tetszőleges témában, belátható időn belül, akár csak a könnyen számszerűsíthető, objektív tartalmakra? És utána a természetes nyelven írt folyószövegben tárolt adatokra?
30

A webfejlesztők, de első

Hidvégi Gábor · 2016. Jan. 12. (K), 14.49
A webfejlesztők, de első körben csak a könnyen megjelölhető adatoknál, például webshopokban. A folyószöveget már most is sok helyen megjelölik, például a weblabon is lehet címkéket adni blogmarkokhoz is.

Lehet kezdeni a munkát!
33

A folyószöveget már most is

Endyl · 2016. Jan. 12. (K), 15.09
A folyószöveget már most is sok helyen megjelölik, például a weblabon is lehet címkéket adni blogmarkokhoz is.

És ez a pár kulcsszó mennyiben ad teljes képet egy blogbejegyzésről? Máshol pont az ilyen kulcsszavas keresésről folyik a panaszkodás.
38

Hozzáállás

Hidvégi Gábor · 2016. Jan. 12. (K), 15.55
Endyl! Emlékeim szerint a Weblaboron eddig szinte kivétel nélkül értelmes dolgokat írtál, viszont az ebben a témában tanúsított hozzáállásod csapnivaló.

Tudom, hogy a probléma összetett, de lehet vele úgy foglalkozni, hogy gyerünk, csináljuk, és legfeljebb nem sikerül, akkor majd módosítunk rajta. De az nem tetszik, ahogy a kifogásokat keresed, hogy valamit miért nehéz megcsinálni. Igen, nehéz. Na, és akkor mi van? Akkor inkább felejtsük el? Oldja meg más helyettünk?

A mesterséges intelligencia egyébként kikerülhetetlen a témában, csak nem mindegy, mikor és hol vonjuk be. A sokak által szentnek tartott Google gőzerővel fejleszti, csak éppen úgy, hogy senki másnak nem lesz hozzáférése, így gyakorlatilag mindenkit kizárnak. Ez nekik jó, mindenki más meg rosszul jár, mert mindenki úgy fog táncolni, ahogy ők fütyülnek.

Ha szemantikusan lennének felcímkézve a webes adatok, akkor lehetősége lenne bármelyik cégnek specializált keresőt írni. Például az ingatlan.com-on megjelenhetne Magyarország összes ingatlanja, vagy az árukeresőn az összes termék. Gondolj bele, mennyi időt lehetne ezzel spórolnia mindenkinek!
39

Akkor kicsit félreértesz. Én

Endyl · 2016. Jan. 12. (K), 16.24
Akkor kicsit félreértesz. Én csak nem látom a kivitelezhetőségét annak, hogy mindenki, mindent felcímkézzen, amit közzétesz a weben. Ha valaki mutat egy módszert, ami nagyságrendekkel javít a mostani állapoton M.I. nélkül, és automatikusan alkalmazható/megtanítható a tartalomgyártó felhasználónak, örömmel használnám, vagy akár segítenék a fejlesztésében. Ugyanakkor ha egy M.I. (még ha nem is általános, csak témaspecifikus) ezt a hatalmas munkát akár szükségtelenné is tenné, akkor miért nem inkább azon dolgozunk? Ahogy mondani szoktad, miért menjünk egy irányba feleslegesen több évig, ha egy másik irány összességében sokkal jobb eredményt adna, sokkal praktikusabb módon?

A témaspecifikus keresők is jók, csak azokat is valakinek karban kellene tartania, illetve mindenkinek egy adott rendszert kellene használnia valamilyen megegyezés alapján. Például mindenféle címkézés nélkül, ha mindenki az ingatlan.com-on hirdetné az ingatlanát, ugyanoda jutnánk el, és mennyi időt spórolnánk meg, mert nem kell még egy rendszert kialakítani, megtanulni, megtanítani, feldolgozni! Ez a valamiben megegyezés inkáb civilizációs probléma, vagy az emberi természeté, aminek a megoldásában szintén szívesen részt vennék.

Szóval nem kifogásokat keresek, hanem válaszokat, iránymutatást, hogy ez a címkézős dolog hogyan kivitelezhető praktikus módon.
40

A "megfogható" objektumokat

Hidvégi Gábor · 2016. Jan. 12. (K), 16.40
A "megfogható" objektumokat tartalmazó oldalakkal kell kezdeni, ahol annyit kell csak tenni, hogy 1, eleve adatként kell kiküldeni mindent, vagy 2, a HTML-t kell feldíszíteni az adatokkal. Ez utóbbi a rosszabb, bár kényelmesebb út, de senkinek sem ajánlanám, hisz a HTML már a kitalálásának pillanatában elavult volt.

Egyelőre megelégednék ennyivel, ez nem nagy kihívás. A folyószövegek már valószínűleg inkább az MI hatáskörébe tartoznak, és egyelőre nem kéne foglalkozni vele.

Javaslom elolvasni a következő blogmark konklúzióját, a macskás képig bezárólag. A mesterséges intelligencia a második választás, én inkább az elsőt javasolnám, mert azzal a többség, az a pár milliárd ember jobban jár.
45

Elméletben statisztikai

inf3rno · 2016. Jan. 13. (Sze), 09.16
Elméletben statisztikai alapon is lehetne tudásgráfot építeni bizonyos pontosságig. Ha megnézzük a szövegeket, és hogy egy-egy szó milyen gyakran szerepel egy szövegben együtt egy másik szóval, akkor abból lehet következtetni arra, hogy a két szó között valamilyen kapcsolat van. Ebből már lehet építeni egy alap gráfot, amiben utána fel kell taggelni, hogy milyen a kapcsolat jellege a szavak között, illetve, kiemelni a többjelentésű szavak külön jelentéseit. A keresés nagyjából annyi, hogy írsz egy templatet, ami a gráf egy bizonyos részére illik. Eredményül az ahhoz a részhez kapcsolódó cikkeket dobja ki a kereső. Fejben én eddig jutottam a témában, de idő hiányában jegeltem ezt a szálat. Szerintem ehhez egyáltalán nem kell MI. Ez csak annyi, hogy beírom, hogy mit keresek, aztán kidob hozzá kapcsolódó dolgokat. Az MI ahhoz kell, hogy a miből hogyan legyen. Szóval megmondom neki, hogy mit akarok, ő kikeresi a kis tudásgráfjából, aztán felépít nekem egy tervet, hogy hogyan tudom megvalósítani. Amíg odáig nem jutunk, addig a mérnököknek lesz munkájuk.
50

Elméletben statisztikai

Endyl · 2016. Jan. 13. (Sze), 12.59
Elméletben statisztikai alapon is lehetne tudásgráfot építeni bizonyos pontosságig.

Egy bizonyos pontosságig igen. Csak ez olyan nyelvek feldolgozásánál elég alacsony lehet, ahol egy máshol szereplő vessző, eltérő szórend, stb. meglehetősen más jelentést is eredményezhet. És azért van "pár" természetes nyelv, amire ez igaz. Sajnos a természetes nyelvek értelmezése nem triviális programozási feladat (különben már minden tolmácsot leváltott volna a google fordító :) ).

Szerintem ez nem nyújtana jelentős javulást a jelenlegi keresési helyzetnek (azt sem tartom kizártnak, hogy a google ilyen jellegű algoritmusokat (is) használ). Persze nem vagyok számítógépes/elméleti nyelvész, csak érdeklődő, így könnyen lehet, hogy nagyot tévedek.
51

Szerintem mindketten laikusok

inf3rno · 2016. Jan. 14. (Cs), 09.33
Szerintem mindketten laikusok vagyunk a témához, és ennél jóval fejlettebb módszerek vannak már, amikkel még mindig nem sikerült megoldani a problémát... ;-)
44

Hát van egy ideje ún.

inf3rno · 2016. Jan. 13. (Sze), 09.07
Hát van egy ideje ún. hashtaggelés, ami egy elég fapados módszer, de ha helyesen használják, akkor elég jól tükrözi, hogy egy-egy bejegyzés mihez kapcsolódik leginkább.
43

ki fogja a címkézést

inf3rno · 2016. Jan. 13. (Sze), 08.30
ki fogja a címkézést elvégezni hatékonyan, konzisztensen, pontosan, minden lényeges részletre/szempontra kitérően, tetszőleges témában, belátható időn belül, akár csak a könnyen számszerűsíthető, objektív tartalmakra


Szvsz. ezeknek a kritériumoknak a nagy részére nincs szükség. Elég ha automatizáltan csak nagyjából valamit összegányol a gép. A maradékon lehet dolgozni, hogy pontosítsuk, kijavítsuk a hibákat. Ha erre a debuggolásra fellőnének valamilyen GUI-t, hogy emberek is tudják csinálni, akkor a gyakran keresett tartalmak pár év alatt használható szintűek lennének, lásd wikipedia. A tudást igénylő tartalmak javítása nyilván sokkal több időt venne igénybe. Pl most legutóbb a béta bomlást néztem wikipedian, és hibásak az egyenletek, amiket írnak. http://physics.stackexchange.com/questions/228929/beta-decay-of-radiocarbon De találkoztam már régebben is komoly tárgyi tévedéssel.
27

Segítsetek keresni!

Há.Zé. · 2016. Jan. 12. (K), 13.42
Szükségem lenne az összes budapesti állatgyógyszertár listájára. (egyetlen kerületét akarom belőle kikeresni, de ez most mellékes).
Hogy lehet egy ilyet megtalálni?
Mert rengeteg találat, ami "teljesnek" hazudja magát, közben én többről tudok, mint ami ezekben összesen szerepel.
Holott ezeknek kellene, hogy legyen valami nyilvántartásuk, nem?
(google maps meg egyenesen szánalmas e tekintetben)
35

Miért van szükséged erre a

Endyl · 2016. Jan. 12. (K), 15.12
Miért van szükséged erre a listára?
36

Mert a macskámnak gyógytáp

Há.Zé. · 2016. Jan. 12. (K), 15.26
Mert a macskámnak gyógytáp kell, ami csak állatpatikában kapható, de a megszokottból kifogyott, a másik megszokott meg túl messze van. :)
Egyébként csak példa volt, hogy még ilyen jellegű infókat is alig vagy egyáltalán nem lehet kipréselni a keresőkből. Vagy próbálj megkeresni bármilyen árukörhöz kapcsolódó egyéb boltokat, pláne ha nincs webáruházuk! Hihetetlen, hogy 2016-ban még itt tartunk. Szóval volna létjogosultsága Gábor elképzelésének...
37

Ha nincs

Endyl · 2016. Jan. 12. (K), 15.53
Ha nincs webshopjuk/weboldaluk (vagy nem hirdetik magukat minél több felületen), úgy nehéz lesz megtalálni őket. Ez nem feltétlenül a keresők hibája, és semmiképpen sem csak az övék.

Ha van, aki publikál ilyen listát/listákat és a kereső ezt meg is találja, akkor az már megint nem feltétlenül a kereső hibája, hogy a lista nem teljes, hanem vagy az illetőnek kellene a teljességre törekednie, vagy az adott "üzletnek" felkeresnie a lista szerzőjét, hogy ő is hadd szerepeljen rajta.

Egyébként a budapesti állatpatika első találatán van egy ilyen szöveg:
Kérjük a fővárosi állatpatikák tulajdonosait, hogy amennyiben ingyenes adatbázisunkban szerepelni kívánnak, a következő adatokat küldjék meg számunkra: [...]

Igaz, hogy elvileg a legutóbbi frissítés 2014 vége, de aki mondjuk szeretné, hogy megtalálják, az lobbizhatna itt.

Továbbra is azon a véleményen vagyok, hogy ha egyetlen darab szövegdoboztól elvárjuk, hogy választ adjon tetszőleges kérdésünkre, akkor meg kell várnunk az általános M.I. elkészültét; ha meg témaspecifikus dolog érdekel, akkor termeljük/termeltessük ki az ahhoz szükséges szakmédiumot.
23

Releváns találat... Nálam az

Há.Zé. · 2016. Jan. 12. (K), 13.20
Releváns találat...
Nálam az első oldalon, a 6-7-8. találatok így néznek ki:
How to Play PC Games That Require SafeDisc or SecuROM DRM ...
www.howtogeek.com/.../how-to-play-pc-games-that-require-safedisc-or-securom-drm-on-windows-10-8.1-8-7-and-vista/ - Tárolt változat
12 Oct 2015 ... How to Make Old Programs Work on Windows 10 ... cannot allow that, because that would be a possible loophole for computer viruses. ... are bad for Windows systems and have been a source of security problems in the past.

How to Upgrade to Windows 10 - Microsoft
https://www.microsoft.com/.../windows/windows-10-upgrade - Tárolt változat
Learn how to get your free upgrade to Windows 10. ... 10 starts up 28% faster than Windows 7, resumes faster, and comes with more security features than ever.

Windows 10 – Microsoft Windows
https://www.microsoft.com/.../windows/features - Tárolt változat
Get the latest news about Windows 10, including the return of the Start Menu and ... And always-enabled updates help you stay current on features and security for .... To check for compatibility and other important installation information, visit ...
Ezeknek mi közük a feltett kérdéshez? Szerintem semmi. :(
34

Konkrétan nincs, de vannak

Endyl · 2016. Jan. 12. (K), 15.10
Konkrétan nincs, de vannak alkalmazható vonatkozásaik (legalábbis szerepelnek bennük a kulcsszavak). Amíg emögött nincs egy M.I., ami megértse, hogy pontosan mit is akarunk (és hogy a tartalomgyártó mit írt le), vagy mi nem "megyünk le" egy gépek által is érthető absztrakciós szintre, sokkal jobb találatok nem lesznek, akárhogy is címkézzük a tartalmunkat.
46

Nekem tök releváns

inf3rno · 2016. Jan. 13. (Sze), 09.24
Nekem tök releváns találatokat dob, ilyen "How to secure Windows 10: The paranoid's guide", gondolom már bekerültem a paranoid listába a három betűs cégeknél, fel vagyok profilozva... :D
48

Van néhány releváns találat.

Há.Zé. · 2016. Jan. 13. (Sze), 10.05
Van néhány releváns találat. De a többség...
Ez már kifejezetten humor kategória. Fapados fedélzetén a keresőkifejezés.
Érdemes megnézni, milyen képeket talál erre a google :D
Arra sem képes, hogy a mobilom két böngészőjében egyforma találatokat adjon és ahogy elnézem, ami utastérről készített kép megjelenik, az sem fapadosé... khm... finoman szólva :)
47

Hogy lehet, hogy a google

Há.Zé. · 2016. Jan. 13. (Sze), 09.54
Hogy lehet, hogy a google indításáig és még azt követően is egy darabig használható volt a keresés? Aztán lassanként jöttek a gugli jobbnál jobb ötletei és most ott tartunk, hogy ha egy hardverről próbálsz információhoz jutni, akkor első oldalakon javarészt magyar webshopok, mögötte meg irreleváns szemét.
Átülsz másik gépre, másik ISP-t (mobilszolgáltató) használsz és 30-80%-ban eltérő találatokat kapsz. Akkor is, ha előzőleg minden cookie-t és hasonló szemetet töröltél mindkét böngészőből.

Vagy: miért nem lehetett legalább opcióként meghagyni, hogy _pontos_ kifejezésre keressen a user? Hiába idézőjelezel, az írásjeleket talán az ékezeteket is, totálisan figyelmen kívül hagyja.
42

A probléma ott van, hogyha

inf3rno · 2016. Jan. 13. (Sze), 08.23
A probléma ott van, hogyha meg is jelölöd a tartalmat, akkor is hozzá kell igazítani a keresőkifejezést. Szóval annak is taggeltnek kell lennie, különben nem fogja tudni a kereső, hogy melyik csigáról van szó, a kakaósról vagy az ipariról, neadjisten az étiről. Ezt lehet inferelni, de akkor meg bejön, hogy minden ember más kontextusból indítja a mondanivalóját, szóval mindenkit meg kell ismernie a keresőnek, és tudnia kell róla, hogy éppen mivel foglalkozik, ami meg kb lehetetlen, hacsak nincs külön MI a házban, ami figyel téged. A probléma ott van, hogy a keresőkifejezések felcímkézésére vagy túl hülyék vagy túl lusták az emberek. Senki nem fog neked sparql-t írni, mert azt sem értik miről van szó. Kellene valami könnyen használható grafikus felület, amin össze lehet kattintani egy ilyet. Pl beírod, hogy csiga és kihoz három képet, hogy melyikre gondolsz, és így tovább. Ugyanígy ha beírsz rövidítést vagy szakkifejezést, annál is választható kell, hogy legyen. Aztán jó lenne, ha tudnál session-t indítani, aminél meg tudod mondani, hogy ebben a keresési session-ben a csiga a kakaóscsigát jelenti, nem az éticsigát, így amikor beírod, hogy "csiga elkészítése", akkor nem francia receptek fognak előjönni. A google a hülyeségeivel ettől iszonyatosan messze van jelenleg. Inkább abba az irányban mennek el, hogy mindenkiről adatot gyűjtenek, megpróbálják megismerni az egyes emberek kontextusát. Mellékesen valszeg többet hoz a konyhára ezeknek az információknak az átadása 3 betűs hivataloknak, mint az, hogy normális keresőt csináljanak. Piacvezető, nincs rá oka, hogy ezen változtasson.