Bestimmung einer repräsentativen Stichprobengröße mit Hilfe von alten Daten

Guten Tag, 

ich habe lange gesucht aber keine passende Fragestellung gefunden die mri bei meinem Problem wirklich weiter hilft, daher stelle ich die Frage nun selbst und hoffe das ihr mein Anliegen versteht und mir helfen könnt.

Also ganz allgemein: Ich will eine repräsentative Stichprobengröße für zukünftige Abfragen bestimmen. 
Folgendes sind die Daten die ich habe:
Ich Frage nur eine Eigenschaft ab welche nur ja oder nein sein kann. 
Ich habe Daten zu beherigen Stichproben welche einen Umfang von jeweil 25 Elementen erfassten. Dabei habe ich nur die Aussage wie viele von den 25 Elementen positiv bzw negativ sind. davon habe ich rund 1000 Datensätze also rund 25.000 Einzelelemente.
In diesem Daten liegt die Spannweite von 0 positiven Ergebnissen pro 25 Abfragen bis zu 8 positiven Ergebnissen pro 25 Abfragen. Die Verteilung dabei ist nicht Normalverteil und sieht ganz im Groben wie folgt aus:
0/25 = 30%
1/25 = 20%
2/25 = 20%
3/25 = 10%
4/25 = 5%
5/25 = 5%
6/25 = 3%
7/25 = 2%
8/25 = 2%
Ich würde die 25.000 EInzelelemente einfach als Gesamtheit annehmen und würde mir davon jetzt gerne eine optimale Stichprobengröße für die Zukunft ableiten.
Die Stichprobe soll hinterher eine Aussage zulassen, dass bei erneuter Wiederholung zu X% (vll 95%) die Abweichung maximal ±1 Ergebnis beträgt.

Ist das mit den gegebenen Angaben möglich? Und wenn ja wie? ich bräuchte dazu Formeln und nach Möglichkeit auch seriöse Quellen :wink:

Vielen Dank