Skip to content

thjbdvlt/commecy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

commecy -- a normalizer for french for spaCy.

x y
chuuuuut!!!!! chut!
bateâu bateau
HO ho
PEùùùT-èTRE peut-être
comencer commencer
auteur-rice-s auteur·rices
peut—être peut-être
autre[ment] autrement
désœuvrement désoeuvrement

installation

pip install git+https://github.com/thjbdvlt/commecy

usage

import spacy

nlp = spacy.blank('fr')
nlp.add_pipe('commecy_normalizer')

for i in nlp("PEEUUUT-étre"):
    print i.norm_

About

normalize french words for spacy.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published