ich habe ne frage zu meinem code. Ich soll die Durchschnittslänge der Wörter eines Textes errechnen mit Python.
1. wieso tuts der join befehl nicht? der löscht mir die leerzeichen nicht, muss ich da was importieren?
2. wie kann ich mehrere verschiedene zeichen durch ein einzelnes zeichen ersetzen, ich habe eher ne drckige lösung dafür in meinem programm verwendet, funktioniert zwar auch, ist aber irre vieel schreibarbeit.
durch das nichtlöschen der leerzeichen werde ich vermutlich einen falschen durchschnittswert herausbekommen...
Der Code sieht wie folgt aus.
Code: Alles auswählen
#! /usr/bin/env python
# *-* coding:utf-8 *-*
from re import sub,findall,DOTALL
text=""""Dies ist ein simpler Beispieltext zur Errrechnung der Durchschnittslänge eines Wortes in einem beliebigen Text."""
text_bereinigt=text.replace(",","").replace(",","").replace(".","").replace(";","").replace(":","").replace("'","").replace("!","").replace("?","")
wortanzahl=text_bereinigt.split()
wert_wortanzahl=float(len(wortanzahl))
zeichenanzahl="".join(text_bereinigt)
wert_zeichenanzahl=float(len(zeichenanzahl))
durchschnittswort=float(wert_zeichenanzahl/len(wortanzahl))
print "Der Text hat folgende Eigenschaften: \n\n",int(wert_wortanzahl)," Wörter \n",int(wert_zeichenanzahl)," Zeichen \n","Das Durchschnittswort hat",durchschnittswort," Zeichen."
Danke!