Alles beschreibare existiert, aber wie finden?

Hallo zusammen,

mich lässt folgende spinnerte Idee nicht mehr los:

Mit ein paar Zeile Programmieraufwand kann ich nacheinander alle möglichen Buchstabenkombinationen für ein Buch von sagen wir mal 100 Seiten erzeugen, einfach von A___ über AA__, ABEL, ABER, …

Damit werde ich in dem unvorstellbare großen Output dieses Programms alle Werke der Weltliteratur mit bis zu 100 Seiten finden, alle wissenschaftlichen und philosophischen Texte, alle möglichen und denkbaren, beschreibbaren Ereignisse, und zwar nicht nur bereits anderweitig existente Dinge, sondern alle überhaupt in allen unser Schriftsystem irgendwie nutzenden Sprachen dieser Welt potentiell möglichen Schriftstücke.

Analog dazu kann ich das Spiel auch mit einer Pixelmatrix machen, und damit alle potentiell möglichen Bilder die sich in dieser Matrix abbilden lassen erzeugen. Auch dies erzeugt natürlich schon bei einer kleinen Matrix eine unglaubliche Datenmenge.

Und genau hier kommt jetzt die Frage: Wie isoliert man aus solchen Datenmengen dann die Ergebnisse (Mustererkennung) die einen Sinn ergeben und etwas beschreiben, was uns bislang noch unbekannt, unverständlich und verborgen ist. Und kann man es schaffen diese Datenmenge so zu reduzieren, dass eine Datenmenge entsteht, die man nach Fachgebieten qualifizieren, und dann entsprechenden Experten vorlegen kann, die so vielleicht zu dem ein oder anderen Gedankenblitz kommen, und Lösungen schwarz auf weiß sauber beschrieben vor sich finden, nach denen sie ggf. schon lange gesucht haben?

Ich denke da an Lexika-Vergleiche, Übereinstimmungsgrade mit bereits bekanntem Material, semantische Überprüfungen, lernende Maschinen, … (mit Plausibilitätsprüfungen müsste man ja sehr vorsichtig sein, weil was wie mit aktuellem Wissen für plausibel halten ggf. genau dem widerspricht, was uns den ein oder anderen großen Durchbruch bringt) um so einen universellen „Forschungsansatz“ zu entwickeln. Wäre eine nette Spielerei für ein großes Grid, und bringt vielleicht mehr, als kosmisches Rauschen zu filtern :wink:

Gruß vom Wiz

Hallo,

Und genau hier kommt jetzt die Frage: Wie isoliert man aus
solchen Datenmengen dann die Ergebnisse (Mustererkennung) die
einen Sinn ergeben und etwas beschreiben,

Gar nicht. Dazu sind die Datenmengen viel zu gross.

Gruesse,
Moritz

Ugh.

Mit ein paar Zeile Programmieraufwand kann ich nacheinander
alle möglichen Buchstabenkombinationen für ein Buch von sagen
wir mal 100 Seiten erzeugen, einfach von A___ über AA__, ABEL,
ABER, …

Grundiziell und prinzisätzlich hast du Recht. Aber der Haken ist ein ziemlich großer:

Wenn wir nur vierstellige „Worte“ zulassen und den Zeichenvorrat auf 26 Buchstaben beschränken, erhalten wir 456976 Möglichkeiten (264), also 456976 Byte.

Erste Erweiterung: Wir lassen den gesamten ASCII-Code mit 255 Zeichen zu: 2554=4.228.250.625 Byte, also etwa vier GB.

Zweite Erweiterung: Alles von zwei bis acht Stellen wird zugelassen: 255^2+255^3+255^4…+255^8=17.948.489.581.465.697.025 Byte, rund und roh 16 Exabyte. Selbst wenn du eine Billion=10^12 Datensätze in der Sekunde erzeugst, brauchst du 17948489 Sekunden, entsprechend 208 Tagen, nur dafür. Die Hälfte dieser Zeitspanne brauchst du im Schnitt für jeden einzelnen Abgleich eines Musters mit dieser Datenmenge (wenn du nicht ganz viel Intelligenz hinterlegst). Weder die Menge an sich noch das Rechentempo noch der beschrobene Abgleich sind realistischerweise leistbar.

Es sei nur darauf hingewiesen, dass acht Stellen relativ wenig sind; Werke wie das eines gewissen Herrn Lennon mit dem Titel „Everybody’s Got Something to Hide Except Me and My Monkey“ (ist zwar nur 'n Liedel) mit 57 Zeichen, entsprechend einer Musterdatenbank mit 10^137 mal irgendwas Stellen passen da schon gar nicht hin. Es gibt geschätzt überitzens etwa 10^80 Atome im Universum …

Man unterschätzt Exponentialfunktionen eben immer wieder gern.

Aga,
CBB

Hallo,

interessante Rechnerei. Allerdings lässt sie außer Acht, dass man ja nicht alle Kombinationen nach genau einer Lösung durchforsten will/muss, sondern sich ja aus der unvorstellbaren Datenmenge eine zwar deutlich kleinere, aber immer noch unvorstellbar große Menge an interessanten Treffern ergibt. Zumal es ja auch von jeder interessanten Lösung eine unvorstellbar große Menge an Varianten gibt, die trotzdem noch genau so verständlich sind, wie der eine perfekte Treffer. Wie hoch mag wohl der Prozentwert an Abweichungen in einer Zeile Text sein, der nicht dazu führt, dass man die Zeile nicht trotzdem verstehen würde? Fünf falsche Buchstaben, von denen jeder 25 falsche Möglichkeiten hat, sind noch gar kein Problem. D.h. Die Datenmenge bleibt zwar wahnsinnig groß, lässt sich aber gegenüber der Angabe der kompletten Zahl an Möglichkeiten schon wieder durchaus dadurch reduzieren, dass jeder Treffer unzählige Male in verständlicher, wenn auch nicht perfekter Form vorkommt.

Und wie wir beim Werfen des Würfels nicht wissen, ob die sechs beim erste oder erst beim 10 Wurf getroffen wird, spricht ja nichts dagegen so ein Ding ein paar hundert Jahre auf immer schneller werdender Hardware laufen zu lassen, und dadurch dann zwar immer noch erst einen Bruchteil aller in der Gesamtmenge steckenden interessanten Lösungen gefunden zu haben, aber vielleicht doch schon die ein oder andere.

Aber wie gesagt, ist eher eine spinnerte Idee, als ein konkret zu realisierender Ansatz. Mich begeistert einfach die Vorstellung der Abgeschlossenheit der Möglichkeiten. Man kann eben eigentlich nicht kreativ sein, wenn man ein Buch schreibt oder ein Bild malt, sondern nimmt letztendlich einfach nur eine von genau berechenbaren x Möglichkeiten eine gewisse Menge Buchstaben oder Pixel anzuordnen.

Gruß vom Wiz

Spinnerst du öfter so rum?
Hallo Wiz,

dann, willkommen im Club, bin ähnlich gestrickt :smile:

Was ja letztliche auch auf eine Programmieaufgabe hinauslaufen würde, nehmen einen menschen wieder zusammenzubauen ist Folgendes.
Insofern kein O.T.

Vor jahren stiess ich mal auf eine sehr interessante Webseite. Dort hatten sie Raumschiff Enterprise, perry Rhodan usw. analysiert, bzw. mit dem „heutigen“ (war vor ca. 6 jahren) Wissen theoretisch möglich wäre umzusetzen.

Daß die in frühen SF-Filmen/Heften von irgendeinem Planeten mit einem kleinen Gerät mit dem Mutterschiff reden konnten, wurde umgesetzt ==>Handys.

Und die Autoren der Seite haben halt viele der bei SF benutzen techn. Dinge auf ihre „heutige“ Umsetzbarkeit geprüft.

Nehmen wir mal das Beamen eines Menschen. Da haben sie glaub erst mal das reine Beamen weggelassen und sich erstmal darauf beschränkt, die Datenmenge zu berechnen/abzuschätzen um jedes Atom, dessen aktuellen Standort im Körper usw. in Echtzeit abzuspeichern.
Vielleicht auch noch andere wichtige Dinge, Quarks oder was es da noch alles geben könnte, kenn mich da nicht so aus.

Jedenfalls kamen sie da auf eine gigantische Datenmenge. Dann haben sie einfach nur geprüft was derzeitige Groß/Schnellrechner wie Gray o.ä. so können. Alles irgendwie zuwenig.
Also Echtzeit sowieso nicht drin, eher Jahre, jahrzehnte oder mehr.

Dann haben sie das Beamen an sich geprüft. Derzeit war es schon in einem Labor gelungen was kleines, Atom o.ä. von A nach B zu beamen.

Aber das war wieder sowas wie in diesen kilometerlangen runden Magnettunneln wo sie irgendwas kreisen lassen bzw. zusammentreffen lassen und dann anhand von irgendwelchen Spuren die entstanden sagen, hier entstand gerade sehr sehr kurzzeitig das Element 251.

Ich fand das alle wahnsinnig spannend zu lesen, falls jemand hier die Seite kennt, bitte sofort her mit dem Link.

@Wiz bei dem was du alles sagtest meinst du die RedundanZ? Daß man also von einer Papierseite mit Text vorne alle ersten Buchstaben abschneiden kann und trotzdem den Text lesen kann.

Danke für das Interesse
Gruß
Reinhard

Hi.

Wenn wir mal das exponentielle Wachstum außen vor lassen (was aber auch meiner Meinung nach ein KO darstellt), haben wir immer noch ein semantisches Problem.

Du erhältst z.B. eine Googillion von mathematischen Ableitungen, bei denen am Ende alles mögliche rauskommt: E=mc2, E=mc3, E=mc4, E=Kragenweite*Schuhgröße, die Existenz von Schokoladenpudding folgt aus der Einkommensteuer usw.

Um nun automatisiert die Spreu vom Weizen zu trennen, müßtest Du Dich in ein Paralleluniversum begeben, in dem Gödels Unvollständigkeitssatz nicht gilt. Am gleichen Problem ist nämlich schon Herr Russell gescheitert mit seiner Principia Mathematica.

Die nächste Beule holst Du Dir, wenn Du alle Verfahrensbeschreibungen aus dem Wust an Daten ausfilterst. Um herauszufinden, ob ein beschriebenes Verfahren irgendein Problem tatsächlich korrekt löst, müßtest Du ein erstmal ein Entscheidungsverfahren für das Halteproblem haben - auch das existiert nicht.

Du kannst also (theoretisch) alle richtigen und sinnvollen Texte generieren, aber nur in einem gewaltigen Rauschen von Datenmüll. Es gibt bewiesenermaßen keine Möglichkeit, automatisiert Sinn und Unsinn zu trennen.

Bliebe noch die Möglichkeit, alles das, was sinnvoll aussieht, auszusortieren (syntaktische Korrektheit), und durch draufschauen zu prüfen.

Welcher der folgenden Ausdrücke beschreibt die Lösung einer quadratischen Gleichung?

x_{1,2} = -\frac{p}{2} { }^-_+ \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = -\frac{p}{2} + \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = -\frac{p}{2} { }^-_+ \sqrt{(\frac{p^2}{2}) - q}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 + q}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{(\frac{q}{2})^2 - p}
x_{1,2} = -\frac{q}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = \frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = \frac{p}{2} { }^+_- \sqrt{(\frac{p^2}{2}) - q}
x_{1,2} = \frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 + q}
x_{1,2} = \frac{p}{2} { }^+_- \sqrt{(\frac{q}{2})^2 - p}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{-(\frac{p}{2})^2 - q}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{2,1} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{2,1} = \frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,1} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{2,1} = -\frac{p}{2} { }^-_+ \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = \frac{-p}{2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = \frac{p}{-2} { }^+_- \sqrt{(\frac{p}{2})^2 - q}
x_{1,2} = -\frac{p}{2} { }^+_- \sqrt{(\frac{p^2}{4}) - q}

Und das waren noch lange nicht alle …
Stimmst Du mir zu, dass die Herleitung wahrscheinlich schneller geht als die Prüfung aller dieser Möglichkeiten?

Fazit: schöne Idee, aber leider nur in der Phantasie möglich.

Gruß,
KHK