GitHub - kuteykin/Natural-Language-Processing: Natural language processing

project Natural-language-processing

Coding Exercises for NLP

Disease_recognition_in_Spanish.ipynb Recognition and tagging of diseases from medical records / scientific literature in Spanish language (Finetuning of pretrained HF model of RoBERTa family on Token Classification task: customisation of NER tagging model for recognition of new entity using spaCy)

NER_Finetuning_HuggingFace_model.ipynb Fine-tuning of RoBERTa family model (from HuggingFace) for Named Entity Recogition: training on specific dataset

Extract_text_from_PDF_to_JSON.ipynb Exploring various methods for text scraping from large PDF files

swear_words_filter_testing.ipynb Evaluation of various approaches for profanity detection / swear words filtering (5 different libraries were tested)

word_frequency_barchart_wordcloud.py Word Frequency Bar Chart and Word Cloud (from Shakespeare’s Hamlet)

Input/ .* Texts for analysis, datasets and Masks for WordCloud

Output/ .* Generated datasets and wordclouds

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Coding Exercises for NLP

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 64 Commits
Input		Input
Output		Output
Extract_text_from_PDF_to_JSON.ipynb		Extract_text_from_PDF_to_JSON.ipynb
NER_Finetuning_HuggingFace_model.ipynb		NER_Finetuning_HuggingFace_model.ipynb
README.md		README.md
disease_recognition_in_Spanish_using_spaCy_ruler.ipynb		disease_recognition_in_Spanish_using_spaCy_ruler.ipynb
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
swear_words_filter_testing.ipynb		swear_words_filter_testing.ipynb
word_frequency_barchart_wordcloud.py		word_frequency_barchart_wordcloud.py

kuteykin/Natural-Language-Processing

Folders and files

Latest commit

History

Repository files navigation

Coding Exercises for NLP

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages