Similarità tra parole e clustering
- Introduzione al concetto di similarità:
-
- https://dataaspirant.com/2015/04/11/five-most-popular-similarity-measures-implementation-in-python/
(implementazione di 5 misure di similarità con Python)
- https://dataaspirant.com/2015/04/11/five-most-popular-similarity-measures-implementation-in-python/
- Uso della libreria Gensim
-
- http://stackoverflow.com/questions/17022691/python-semantic-similarity-score-for-strings
(in cui viene suggerito questo tutorial per il calcolo della similarità: http://radimrehurek.com/gensim/tut1.html)
- http://stackoverflow.com/questions/17022691/python-semantic-similarity-score-for-strings
- Uso della libreria NLTK:
-
- http://stackoverflow.com/questions/30829382/check-the-similarity-between-two-words-with-nltk-with-python
(similarità di parole usando la libreria NLTK) - http://tech.swamps.io/recipe-text-clustering-using-nltk-and-scikit-learn/
(clustering di testo mediante k-means)
- http://stackoverflow.com/questions/30829382/check-the-similarity-between-two-words-with-nltk-with-python
- Uso della similarità del coseno:
-
- http://stackoverflow.com/questions/15173225/how-to-calculate-cosine-similarity-given-2-sentence-strings-python
(similarità di parole mediante similarità del coseno)
- http://stackoverflow.com/questions/15173225/how-to-calculate-cosine-similarity-given-2-sentence-strings-python
- Uso degli N-grammi
-
- https://github.com/smilli/clust/blob/master/clust/cluster.py
(clustering mediante n-grammi) - https://pypi.python.org/pypi/ngram
(libreria di Python per il calcolo della similarità mediante n-grammi)
- https://github.com/smilli/clust/blob/master/clust/cluster.py
Da verificare
- http://douglasduhaime.com/blog/clustering-semantic-vectors-with-python
(clustering di vettori semantici) - http://brandonrose.org/clustering
(clustering di documenti) - http://stackoverflow.com/questions/12117576/how-to-count-word-frequencies-within-a-file-in-python
(frequenza di una parola all'interno di un file).