You are viewing a single comment's thread from:

RE: 3 days ~ Evaluating the curation effort of aicu

in #blog5 years ago

Ist im Prinzip ein Ranking/Recommendation System, ähnliche Sachen setzt auch Google/Facebook ein um Inhalte im feed vorzuschlagen ;)

Der bot läuft komplett selbstständig. Das einzige wo ich in Zukunft evtl eingreifen werde ist wenn ein Plagiat ausgewählt wird. Im Moment schau ich ob cheetah den Post flagged, aber mit den neuen Post Zeiten ist das jetzt etwas knapp.

Und ja, bei sprachmodellen hat sich die letzten Jahrzehnte sehr viel getan. Gerade dieses Jahr kam mit GPT-2 und BERT viele Neuerungen hinzu. (zwar noch fraglich, ob die Modelle wirklich so gut sind, aber das ist ne längere Geschichte)

In Computerlinguistik hast du auch normale Linguistik Vorlesungen, da geht's auch mehr in die Geisteswissenschaftliche Richtung und auch philosophischer. Computerlinguistik ist zumindest an meiner Uni mehr auf die theoretische Basis ausgerichtet. Sprache beschrieben mit formaler Logik, Datenstrukturen die ligustische Ideen einfangen etc (gesprochen und geschrieben) . Und natürlich viel KI, Machine learning uvm. Ist schon eine interessante Kombi Sprache so zu sehen und zu kennenzulernen. Aber auch reine Linguistik ist faszinierend

Posted using Partiko Android

Sort:  

Du meinst den berühmten Algorithmus, nach dem Content eine bestimmte Vielfalt zeigen muss, ja?

Ja, die neuesten Post-Zeiten sind wie alle HF-Änderungen immer zwei- oder mehrgesichtig. Sie eliminieren einen Nachteil und schaffen dafür einen anderen.

Warum bist du auf Steemit? Frage ich aus Neugier. Ist es für dich ein Experiment, eine Plattform, wo du für deine persönlichen Ziele etwas lernen kannst?

Ich befasse mich ab und zu mal mit KI und dem Versuch, Menschlichkeit nachzuahmen. Ich hatte dazu mal einen sehr interessanten Artikel gelesen, der entgegen der Mainstream-Verbreitungen etwas differenziertere Informationen gab.

"Formale Logik" müsste ich erst recherchieren, was das ist. Wie Datenstrukturen linguistische Ideen einfangen, stelle ich mir überaus komplex, bis unmöglich vor. Eine Unterhaltung, die ich einst darüber führte mit jemandem, kannst du hier finden: https://steemit.com/thoughts/@oendertuerk/would-it-be-possible-to-download-skills-into-your-brain-like-in-the-movie-matrix - wenn du gaaanz viel Zeit hast :)

Wobei die Frage wäre, was genau "Linguistische Ideen" sind.
Grüße!

Nein, damit habt das nichts zu tun. Es geht eher um ähnlichkeit zu Nutzer/Gruppen präferenzen. Aicu fängt z. B. die Präferenz von den großen curatoren Netzwerken (Curie in erster Linie) ein, zumindest versucht es das. welchen algo meinst du?

Imo waren die 15 Minuten davor ideal was Plagiate anging. Cheetah arbeitet recht schnell, aber nicht 5 min schnell.

Auf steemit bin ich gelandet weil ich ne blogging Plattform gesucht hab. Medium war mir suspekt und von steemit hab ich öfters am Rand was mitbekommen.
Bin seit 2016 im Crypto Bereich unterwegs, da schnappt man das ein oder andere auf.
Und da mir das Konzept von Dezentralisierter content plattform/social media gefallen hat, bin ich geblieben und hab anfangs über Silber/Gold münzen gepostet.

Dann hab ich gesehen wie einfach man mit der steem blockchain interagieren kann programmiertechnisch und hab angefangen den curator bot zu schreiben. Ist ja recht nahe an meinem Fachgebiet dran, da hat sich das ganze ergeben. Der SM bot ist entstanden weil ich meine Reinforcement Learning Kenntnisse verbessern wollte.

Linguistische Ideen meint Konzepte und Theorien über sprachverständnis, sprachbedeutung, Struktur uvm. Da gibt's dann z. B. Mathematische Konstrukte die sicherstellen das Sachen wie kasus, numerus etc in einem Satz korrekt "vergeben" werden. Nennt sich Linear Funktionale Grammatik. Oder allgemein satzstruktur (Syntax Bäume z. B. Sind Visualisierungen von formalen grammatiken die oft dafür benutzt werden). Gibt noch viele mehr, aber das mal als Grundidee.

Linguistische Ideen werden ziemlich erfolgreich seit viele Jahrzehnten umgesetzt in der informatik, gerade neuronale Netzwerke ermöglichen interessante höherdimensionale Repräsentation von Daten die auch viele sprachliche Relationen gut einfangen. Aber das Rad neu erfinden tun sie nicht.

Formale logik ist nen Oberbegriff für Sachen wie Aussagenlogik, Prädikatenlogik (1.,2. Etc Ordnung) Modallogik, Temporale Logik uvm. Den Post schau ich mir später dann mal an :)

es ist eher die Unterhaltung unter dem Post, nicht der Blog-Artikel selbst.

Ich bin als Sozialarbeiterin (und Systemikerin in diesem Bereich der menschlichen Psychologie) meinerseits irritiert davon, dass Leute, die sich mit der Beobachtung von Sprache, Körper-Signalen, Interpretation von Ausdruck, bestimmten Wort-Vorlieben, Verwendung bestimmter sich wiederholender Narrative nicht auskennen, sich allzu viel von einer AI erwarten. Ich bin in dieser Richtung manchmal im Austausch, weil ich weiß, dass das, was jemand verbal ausdrückt, im Grunde immer sein ganzes menschliches Erfahren abbildet, ohne es konkret machen zu können, sondern oft eher symbolisch und sehr unspezifisch. Und widersprüchlich.

HaHa, du nennst Begriffe, die aus der Science Fiction kommen könnten. "Temporal-Logik", ich musste sofort an Startrek und Captain Archer denken. LOL. Dabei ist es sicher etwas Seriöses. Logik ... wenn ich anfange, darüber nachzudenken oder zu recherchieren,.... argh ....

Linguistische Ideen werden ziemlich erfolgreich seit viele Jahrzehnten umgesetzt in der informatik, gerade neuronale Netzwerke ermöglichen interessante höherdimensionale Repräsentation von Daten die auch viele sprachliche Relationen gut einfangen

Ich erbitte ein Beispiel, welches für mich griffig ist. Kenne ich das als Otto Normalo?

Ach so, der Algo: irgendwo habe ich gelesen, dass einige bots hier "Vielfalt" als Voraussetzung für ihr Aufspüren von Content haben. Bestimmte Anzahl Bildmaterial, Begriffe, die insgesamt eher wenig verwendet werden, im Grunde das Gegenteil von dem, was du über Curie gesagt hast. Kann mich aber auch getäuscht haben. Manchmal ist Erinnerung trickreich.

Dann hatte ich noch an den youtube algo gedacht. Der auf Präferenzen geht usw.

Habs gerade überflogen, ich schaus mir morgen in ruhe an, zu den anderen sachen:

Nicht sicher ob du mich meinst mit der anspielung :P aber es wird oft zu viel von AI erwartet. Hab an der uni mit vielen Aspekten von Sprache und AI herumgespielt. Facebook oder Twitter hat da etwas cooles gemacht, potentiell suizidgefährdete Menschen anhand "Schreibstil" erkennen. Die Sache mit paralinguistischen signalen, unterbewussten etc ist schwer einzufangen. man braucht dafür viele datenbeispiele dann kann man probieren ein Machine Learning modell drauf zu trainieren. Aber wurde meines wissens noch nicht gemacht. Mich würds aber nicht wundern wenn google und co mit hochdruck versuchen an solche daten zu kommen. Daten sind in dem sinn das neue Gold. Unterm strich ist AI nix anderes als mustererkennung oder verhaltensweisen erlernen.

Was denkst woher Startrek seine inspirationen zieht ;) Temporal Logik ist jetzt nicht der günstigste Einstieg, wenn du dir das anschauen willst fang bei Aussagen und Prädikatenlogik an. Ist aber sehr trocken.

Wegen Beispiel, als Otto Normalverbraucher wirst davon glaub nix kennen. Du interagierst eher mit blackboxes. Suchmaschinen basiert auf Erkenntnissen aus Computerlinguistik, Google Translate auch. Siri usw.

Wenn du neuronale netzwerke speziell meinst, dann lässt sich am einfachsten die höherdimensionale Repräsentation anhand von neuronalen Netzen und BIlderkennung erklären. Am anfang erkennt das netzwerk klare kanten, ebene flächen etc. Dann abstrahiert es daraus linien, geometrische objekte etc. Dann komplexere objekte, ein Rad usw. Jede neuronale ebene hat das potential die daten zu abstrahieren, aufzubereiten und bestimmte strukturen weiterzuverarbeiten.

da ist ein beispiel mit bilderkennung und einer art neuronalen netzwerken.

Bei Sprachverarbeitung finde ich das beispiel Wortartenerkennung sehr anschaulich:

Man kann eine wortartenerkennung auf zeichenebene trainieren. dann erkennt es langsam strukturen z.b. wenn ein wort auf "heit" endet, dann ist es wahrscheinlich eine nominalphrase. Im englischen ist es mit "ing" wahrscheinlich eine verb usw.

Dann kommt der kontext vom wort ins spiel, also welche Wörter in der nähe stehen. "can" vs "can". "Can you can a can" ist nen fieser satz wo man sieht wie wichtig context ist. weil wenn du die wörter da einzeln betrachtest kannst nicht sagen welche wortart sie haben. Das ist z.b. auch eine Kernidee aus der Linguistik die auf viele arten und weisen verwnedet wird: "You shall know a word by the company it keeps". Dadurch kann man die bedeutung der Worte bestimmen und wortähnlichkeiten bestimmen.

Wegen algo, wenn du "vielfalt" so verstehst, dann funktioniert jeder Machine Learning algo so. es versucht muster zu finden die die "klassifikationsklassen" unterscheidet. Also einfach gesagt: wenn ein post nur aus einem wort besteht ist es warscheinlich ein schlechter. Der algo erkennt auch themen, und andere wortbeziehungen. Textstrukturen, also indirekt auch schreibstil etc.

Kanns dir mal etwas detaillierter erklären, aber ich will jetzt erstmal mit dieser Textwall fertig werden :D

Danke dir für deine Ausführungen. Ja, bestimmte Schwierigkeiten sehe ich bei der AI zum Beispiel beim deepl.com Übersetzer. Es ist lustig, die Fehler zu erkennen, die das Programm macht. Es kann noch nicht genau unterscheiden zwischen "sie", "Sie" und weibliche Form oder Mehrzahl usw. Ist auch schwierig, wenn man überlegt und daher ist dein Satz "You shall know a word by the company it keeps" ganz ausgezeichnet!

Ich finde das trifft es wirklich gut! Davon abgesehen klingelt bei mir das Philosophenohr bei dieser Aussage.

Habe spaßeshalber "Can you can a can" bei deepl. eingetippt und es sagt: "Kannst du eine Dose haben", LOL
Ist aber auch ein gemeiner Satz, den man so auch wohl nicht sagen würde.

Das mit der Bilderkennung habe ich schon mal irgendwo gesehen, auch interessant.

Ich wäre an einer Schreibstil-Analyse interessiert. Was wohl das Ergebnis wäre ... vielleicht lieber nicht, LOL :D

Schönes Wochenende für dich.

Coin Marketplace

STEEM 0.25
TRX 0.20
JST 0.037
BTC 96006.08
ETH 3568.65
USDT 1.00
SBD 3.77