Comparing version 0.1.8 to 0.1.9
@@ -0,1 +1,2 @@ | ||
// Original copyright: | ||
/* | ||
@@ -23,8 +24,38 @@ Copyright (c) 2017, Micael Levi | ||
// a list of commonly used words that have little meaning and can be excluded | ||
// This version: | ||
/* | ||
The MIT License (MIT) | ||
Copyright (c) 2017 Fabrício Rodrigues | ||
Permission is hereby granted, free of charge, to any person obtaining a copy | ||
of this software and associated documentation files (the "Software"), to deal | ||
in the Software without restriction, including without limitation the rights | ||
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell | ||
copies of the Software, and to permit persons to whom the Software is | ||
furnished to do so, subject to the following conditions: | ||
The above copyright notice and this permission notice shall be included in all | ||
copies or substantial portions of the Software. | ||
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR | ||
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, | ||
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE | ||
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER | ||
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, | ||
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE | ||
SOFTWARE. | ||
*/ | ||
// a list of commonly used words (pt-BR) that have little meaning and can be excluded | ||
// from analysis. | ||
var words = [ | ||
'a', | ||
'à', | ||
'adeus', | ||
'agora', | ||
'aí', | ||
'ainda', | ||
'além', | ||
'algo', | ||
'alguém', | ||
@@ -35,2 +66,3 @@ 'algum', | ||
'alguns', | ||
'ali', | ||
'ampla', | ||
@@ -40,2 +72,4 @@ 'amplas', | ||
'amplos', | ||
'ano', | ||
'anos', | ||
'ante', | ||
@@ -45,2 +79,4 @@ 'antes', | ||
'aos', | ||
'apenas', | ||
'apoio', | ||
'após', | ||
@@ -51,7 +87,28 @@ 'aquela', | ||
'aqueles', | ||
'aqui', | ||
'aquilo', | ||
'área', | ||
'as', | ||
'às', | ||
'assim', | ||
'até', | ||
'atrás', | ||
'através', | ||
'baixo', | ||
'bastante', | ||
'bem', | ||
'boa', | ||
'boas', | ||
'bom', | ||
'bons', | ||
'breve', | ||
'cá', | ||
'cada', | ||
'catorze', | ||
'cedo', | ||
'cento', | ||
'certamente', | ||
'certeza', | ||
'cima', | ||
'cinco', | ||
'coisa', | ||
@@ -61,9 +118,17 @@ 'coisas', | ||
'como', | ||
'conselho', | ||
'contra', | ||
'contudo', | ||
'custa', | ||
'da', | ||
'dá', | ||
'dão', | ||
'daquela', | ||
'daquelas', | ||
'daquele', | ||
'daqueles', | ||
'dar', | ||
'das', | ||
'de', | ||
'debaixo', | ||
'dela', | ||
@@ -73,3 +138,6 @@ 'delas', | ||
'deles', | ||
'demais', | ||
'dentro', | ||
'depois', | ||
'desde', | ||
'dessa', | ||
@@ -82,3 +150,2 @@ 'dessas', | ||
'deste', | ||
'deste', | ||
'destes', | ||
@@ -95,2 +162,9 @@ 'deve', | ||
'deviam', | ||
'dez', | ||
'dezanove', | ||
'dezasseis', | ||
'dezassete', | ||
'dezoito', | ||
'dia', | ||
'diante', | ||
'disse', | ||
@@ -102,4 +176,9 @@ 'disso', | ||
'dizem', | ||
'dizer', | ||
'do', | ||
'dois', | ||
'dos', | ||
'doze', | ||
'duas', | ||
'dúvida', | ||
'e', | ||
@@ -112,5 +191,9 @@ 'é', | ||
'em', | ||
'embora', | ||
'enquanto', | ||
'entre', | ||
'era', | ||
'eram', | ||
'éramos', | ||
'és', | ||
'essa', | ||
@@ -124,3 +207,5 @@ 'essas', | ||
'estão', | ||
'estar', | ||
'estas', | ||
'estás', | ||
'estava', | ||
@@ -130,7 +215,34 @@ 'estavam', | ||
'este', | ||
'esteja', | ||
'estejam', | ||
'estejamos', | ||
'estes', | ||
'esteve', | ||
'estive', | ||
'estivemos', | ||
'estiver', | ||
'estivera', | ||
'estiveram', | ||
'estivéramos', | ||
'estiverem', | ||
'estivermos', | ||
'estivesse', | ||
'estivessem', | ||
'estivéssemos', | ||
'estiveste', | ||
'estivestes', | ||
'estou', | ||
'etc', | ||
'eu', | ||
'exemplo', | ||
'faço', | ||
'falta', | ||
'favor', | ||
'faz', | ||
'fazeis', | ||
'fazem', | ||
'fazemos', | ||
'fazendo', | ||
'fazer', | ||
'fazes', | ||
'feita', | ||
@@ -140,10 +252,53 @@ 'feitas', | ||
'feitos', | ||
'fez', | ||
'fim', | ||
'final', | ||
'foi', | ||
'fomos', | ||
'for', | ||
'fora', | ||
'foram', | ||
'fôramos', | ||
'forem', | ||
'forma', | ||
'formos', | ||
'fosse', | ||
'fossem', | ||
'fôssemos', | ||
'foste', | ||
'fostes', | ||
'fui', | ||
'geral', | ||
'grande', | ||
'grandes', | ||
'grupo', | ||
'há', | ||
'haja', | ||
'hajam', | ||
'hajamos', | ||
'hão', | ||
'havemos', | ||
'havia', | ||
'hei', | ||
'hoje', | ||
'hora', | ||
'horas', | ||
'houve', | ||
'houvemos', | ||
'houver', | ||
'houvera', | ||
'houverá', | ||
'houveram', | ||
'houvéramos', | ||
'houverão', | ||
'houverei', | ||
'houverem', | ||
'houveremos', | ||
'houveria', | ||
'houveriam', | ||
'houveríamos', | ||
'houvermos', | ||
'houvesse', | ||
'houvessem', | ||
'houvéssemos', | ||
'isso', | ||
@@ -154,7 +309,22 @@ 'isto', | ||
'lá', | ||
'lado', | ||
'lhe', | ||
'lhes', | ||
'lo', | ||
'local', | ||
'logo', | ||
'longe', | ||
'lugar', | ||
'maior', | ||
'maioria', | ||
'mais', | ||
'mal', | ||
'mas', | ||
'máximo', | ||
'me', | ||
'meio', | ||
'menor', | ||
'menos', | ||
'mês', | ||
'meses', | ||
'mesma', | ||
@@ -166,4 +336,6 @@ 'mesmas', | ||
'meus', | ||
'mil', | ||
'minha', | ||
'minhas', | ||
'momento', | ||
'muita', | ||
@@ -174,12 +346,25 @@ 'muitas', | ||
'na', | ||
'nada', | ||
'não', | ||
'naquela', | ||
'naquelas', | ||
'naquele', | ||
'naqueles', | ||
'nas', | ||
'nem', | ||
'nenhum', | ||
'nenhuma', | ||
'nessa', | ||
'nessas', | ||
'nesse', | ||
'nesses', | ||
'nesta', | ||
'nestas', | ||
'neste', | ||
'nestes', | ||
'ninguém', | ||
'nível', | ||
'no', | ||
'noite', | ||
'nome', | ||
'nos', | ||
@@ -191,6 +376,21 @@ 'nós', | ||
'nossos', | ||
'nova', | ||
'novas', | ||
'nove', | ||
'novo', | ||
'novos', | ||
'num', | ||
'numa', | ||
'número', | ||
'nunca', | ||
'o', | ||
'obra', | ||
'obrigada', | ||
'obrigado', | ||
'oitava', | ||
'oitavo', | ||
'oito', | ||
'onde', | ||
'ontem', | ||
'onze', | ||
'os', | ||
@@ -203,2 +403,6 @@ 'ou', | ||
'para', | ||
'parece', | ||
'parte', | ||
'partir', | ||
'paucas', | ||
'pela', | ||
@@ -214,4 +418,7 @@ 'pelas', | ||
'perante', | ||
'perto', | ||
'pode', | ||
'pude', | ||
'pôde', | ||
'podem', | ||
'podendo', | ||
@@ -223,6 +430,14 @@ 'poder', | ||
'podiam', | ||
'põe', | ||
'põem', | ||
'pois', | ||
'ponto', | ||
'pontos', | ||
'por', | ||
'porém', | ||
'porque', | ||
'porquê', | ||
'posição', | ||
'possível', | ||
'possivelmente', | ||
'posso', | ||
@@ -233,2 +448,4 @@ 'pouca', | ||
'poucos', | ||
'primeira', | ||
'primeiras', | ||
'primeiro', | ||
@@ -240,3 +457,10 @@ 'primeiros', | ||
'próprios', | ||
'próxima', | ||
'próximas', | ||
'próximo', | ||
'próximos', | ||
'pude', | ||
'puderam', | ||
'quais', | ||
'quáis', | ||
'qual', | ||
@@ -246,32 +470,94 @@ 'quando', | ||
'quantos', | ||
'quarta', | ||
'quarto', | ||
'quatro', | ||
'que', | ||
'quê', | ||
'quem', | ||
'quer', | ||
'quereis', | ||
'querem', | ||
'queremas', | ||
'queres', | ||
'quero', | ||
'questão', | ||
'quinta', | ||
'quinto', | ||
'quinze', | ||
'relação', | ||
'sabe', | ||
'sabem', | ||
'são', | ||
'se', | ||
'segunda', | ||
'segundo', | ||
'sei', | ||
'seis', | ||
'seja', | ||
'sejam', | ||
'sejamos', | ||
'sem', | ||
'sempre', | ||
'sendo', | ||
'ser', | ||
'será', | ||
'serão', | ||
'serei', | ||
'seremos', | ||
'seria', | ||
'seriam', | ||
'seríamos', | ||
'sete', | ||
'sétima', | ||
'sétimo', | ||
'seu', | ||
'seus', | ||
'sexta', | ||
'sexto', | ||
'si', | ||
'sido', | ||
'sim', | ||
'sistema', | ||
'só', | ||
'sob', | ||
'sobre', | ||
'sois', | ||
'somos', | ||
'sou', | ||
'sua', | ||
'suas', | ||
'tal', | ||
'talvez', | ||
'também', | ||
'tampouco', | ||
'tanta', | ||
'tantas', | ||
'tanto', | ||
'tão', | ||
'tarde', | ||
'te', | ||
'tem', | ||
'tém', | ||
'têm', | ||
'temos', | ||
'tendes', | ||
'tendo', | ||
'tenha', | ||
'tenham', | ||
'tenhamos', | ||
'tenho', | ||
'tens', | ||
'ter', | ||
'terá', | ||
'terão', | ||
'terceira', | ||
'terceiro', | ||
'terei', | ||
'teremos', | ||
'teria', | ||
'teriam', | ||
'teríamos', | ||
'teu', | ||
'teus', | ||
'teve', | ||
'ti', | ||
@@ -281,2 +567,16 @@ 'tido', | ||
'tinham', | ||
'tínhamos', | ||
'tive', | ||
'tivemos', | ||
'tiver', | ||
'tivera', | ||
'tiveram', | ||
'tivéramos', | ||
'tiverem', | ||
'tivermos', | ||
'tivesse', | ||
'tivessem', | ||
'tivéssemos', | ||
'tiveste', | ||
'tivestes', | ||
'toda', | ||
@@ -287,2 +587,5 @@ 'todas', | ||
'todos', | ||
'trabalho', | ||
'três', | ||
'treze', | ||
'tu', | ||
@@ -300,9 +603,26 @@ 'tua', | ||
'uns', | ||
'vai', | ||
'vais', | ||
'vão', | ||
'vários', | ||
'vem', | ||
'vêm', | ||
'vendo', | ||
'vens', | ||
'ver', | ||
'vez', | ||
'vezes', | ||
'viagem', | ||
'vindo', | ||
'vinte', | ||
'vir', | ||
'você', | ||
'vocês', | ||
'vos', | ||
'vós', | ||
'vossa', | ||
'vossas', | ||
'vosso', | ||
'vossos', | ||
'zero', | ||
'1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '_' | ||
@@ -309,0 +629,0 @@ ] |
{ | ||
"name": "stopword", | ||
"version": "0.1.8", | ||
"version": "0.1.9", | ||
"description": "A module for node.js that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 19 languages and also takes lists with custom stopwords as input.", | ||
@@ -5,0 +5,0 @@ "main": "lib/stopword.js", |
@@ -83,2 +83,5 @@ # stopword | ||
#### Your language missing? | ||
If you can't find a stopword file for your language, you can try creating one with [`stopword-trainer`](https://github.com/eklem/stopword-trainer). | ||
### removeStopwords | ||
@@ -113,2 +116,4 @@ | ||
version 0.1.9 Longer Brazilian Portugese stopword list w/ duplicates removed | ||
[license-image]: http://img.shields.io/badge/license-MIT-blue.svg?style=flat | ||
@@ -115,0 +120,0 @@ [license-url]: LICENSE |
License Policy Violation
LicenseThis package is not allowed per your license policy. Review the package's license to ensure compliance.
Found 1 instance in 1 package
License Policy Violation
LicenseThis package is not allowed per your license policy. Review the package's license to ensure compliance.
Found 1 instance in 1 package
74459
1559
124