Hallo!
Erstmal: Geht es immernoch darum, daß du 3x2x1mm Platz für Chips hast? Dann vergiß es, das ist deutlich zu wenig Platz, da bekommst du nicht mal die Kabel dran.
Zur technischen Umsetzung: Man muß keine 8 Bit übertragen, denn die dezentralen Chips werden keine 256 Tasten haben. Mit drei Bits könnte man acht Tasten verwalten, alles andere übernimmt der zentrale Chip dann.
Allerdings haben die meisten Microcontroller ne serielle Datenübertragung wie I2C und SPI eingebaut, die zwar immer 8 Bit verschickt, aber auch deutlich schneller ist, als wenn man ihnen ne 3Bit-Übertragung beibringt. Und 115000Bit/s schaffen die meisten. Die Verzögerung durch mehrere Chips wird sich daher sicherlich deutlich geringer als 1ms ausfallen, das ist kein Problem.
Übrigens, wenn man viele Tasten hat, benutzt man meist ne Matrix zum Auslesen, und verdrahtet nicht jede Taste einzeln:
| | |
---1---2---3
| | |
---4---5---6
| | |
---7---8---9
Man hat hier drei waagerechte und drei senkrechte Leitungen. Beim Drücken der Taste 7 wird die dritte waagerechte mit der ersten senkrechten verbunden. So braucht man nur sechs Leitungen für neun Tasten. Nachteil: wenn man 5 und 7 gleichzeitig drückt, ist das das gleiche wie 4 und 8.
Für 50 Tasten käme man mit 5x10=15 Leitungen aus. Wenn du die Tasten in zehn Gruppen mit je 5 Tasten unterteilst, bekommst du unterm Strich mehr Kabel.