You are viewing a single comment's thread from:

RE: 3 days ~ Evaluating the curation effort of aicu

in #blog5 years ago

Habs gerade überflogen, ich schaus mir morgen in ruhe an, zu den anderen sachen:

Nicht sicher ob du mich meinst mit der anspielung :P aber es wird oft zu viel von AI erwartet. Hab an der uni mit vielen Aspekten von Sprache und AI herumgespielt. Facebook oder Twitter hat da etwas cooles gemacht, potentiell suizidgefährdete Menschen anhand "Schreibstil" erkennen. Die Sache mit paralinguistischen signalen, unterbewussten etc ist schwer einzufangen. man braucht dafür viele datenbeispiele dann kann man probieren ein Machine Learning modell drauf zu trainieren. Aber wurde meines wissens noch nicht gemacht. Mich würds aber nicht wundern wenn google und co mit hochdruck versuchen an solche daten zu kommen. Daten sind in dem sinn das neue Gold. Unterm strich ist AI nix anderes als mustererkennung oder verhaltensweisen erlernen.

Was denkst woher Startrek seine inspirationen zieht ;) Temporal Logik ist jetzt nicht der günstigste Einstieg, wenn du dir das anschauen willst fang bei Aussagen und Prädikatenlogik an. Ist aber sehr trocken.

Wegen Beispiel, als Otto Normalverbraucher wirst davon glaub nix kennen. Du interagierst eher mit blackboxes. Suchmaschinen basiert auf Erkenntnissen aus Computerlinguistik, Google Translate auch. Siri usw.

Wenn du neuronale netzwerke speziell meinst, dann lässt sich am einfachsten die höherdimensionale Repräsentation anhand von neuronalen Netzen und BIlderkennung erklären. Am anfang erkennt das netzwerk klare kanten, ebene flächen etc. Dann abstrahiert es daraus linien, geometrische objekte etc. Dann komplexere objekte, ein Rad usw. Jede neuronale ebene hat das potential die daten zu abstrahieren, aufzubereiten und bestimmte strukturen weiterzuverarbeiten.

da ist ein beispiel mit bilderkennung und einer art neuronalen netzwerken.

Bei Sprachverarbeitung finde ich das beispiel Wortartenerkennung sehr anschaulich:

Man kann eine wortartenerkennung auf zeichenebene trainieren. dann erkennt es langsam strukturen z.b. wenn ein wort auf "heit" endet, dann ist es wahrscheinlich eine nominalphrase. Im englischen ist es mit "ing" wahrscheinlich eine verb usw.

Dann kommt der kontext vom wort ins spiel, also welche Wörter in der nähe stehen. "can" vs "can". "Can you can a can" ist nen fieser satz wo man sieht wie wichtig context ist. weil wenn du die wörter da einzeln betrachtest kannst nicht sagen welche wortart sie haben. Das ist z.b. auch eine Kernidee aus der Linguistik die auf viele arten und weisen verwnedet wird: "You shall know a word by the company it keeps". Dadurch kann man die bedeutung der Worte bestimmen und wortähnlichkeiten bestimmen.

Wegen algo, wenn du "vielfalt" so verstehst, dann funktioniert jeder Machine Learning algo so. es versucht muster zu finden die die "klassifikationsklassen" unterscheidet. Also einfach gesagt: wenn ein post nur aus einem wort besteht ist es warscheinlich ein schlechter. Der algo erkennt auch themen, und andere wortbeziehungen. Textstrukturen, also indirekt auch schreibstil etc.

Kanns dir mal etwas detaillierter erklären, aber ich will jetzt erstmal mit dieser Textwall fertig werden :D

Sort:  

Danke dir für deine Ausführungen. Ja, bestimmte Schwierigkeiten sehe ich bei der AI zum Beispiel beim deepl.com Übersetzer. Es ist lustig, die Fehler zu erkennen, die das Programm macht. Es kann noch nicht genau unterscheiden zwischen "sie", "Sie" und weibliche Form oder Mehrzahl usw. Ist auch schwierig, wenn man überlegt und daher ist dein Satz "You shall know a word by the company it keeps" ganz ausgezeichnet!

Ich finde das trifft es wirklich gut! Davon abgesehen klingelt bei mir das Philosophenohr bei dieser Aussage.

Habe spaßeshalber "Can you can a can" bei deepl. eingetippt und es sagt: "Kannst du eine Dose haben", LOL
Ist aber auch ein gemeiner Satz, den man so auch wohl nicht sagen würde.

Das mit der Bilderkennung habe ich schon mal irgendwo gesehen, auch interessant.

Ich wäre an einer Schreibstil-Analyse interessiert. Was wohl das Ergebnis wäre ... vielleicht lieber nicht, LOL :D

Schönes Wochenende für dich.

Coin Marketplace

STEEM 0.25
TRX 0.20
JST 0.038
BTC 96845.67
ETH 3584.40
USDT 1.00
SBD 3.79