Я создал таблицу, которая заполнена ответами людей, заявленных как первое, что пришло им в голову, когда они просматривали фотографию. У меня есть ~ 1400 записей. Теперь я хочу посмотреть, что является самым распространенным описанием.Подсчитайте наиболее часто используемые слова в таблице, отфильтруйте стоп-слова
CREATE TABLE descript (
wordID int NOT NULL AUTO_INCREMENT PRIMARY KEY,
wordText TEXT(50)
)
ENGINE=MyISAM;
INSERT INTO descript VALUES(0,"Big");
INSERT INTO descript VALUES(0,"blue");
INSERT INTO descript VALUES(0,"blue");
INSERT INTO descript VALUES(0,"fast");
INSERT INTO descript VALUES(0,"impressive");
INSERT INTO descript VALUES(0,"big");
INSERT INTO descript VALUES(0,"big");
INSERT INTO descript VALUES(0,"red");
INSERT INTO descript VALUES(0,"his");
INSERT INTO descript VALUES(0,"her");
INSERT INTO descript VALUES(0,"His");
INSERT INTO descript VALUES(0,"Black");
INSERT INTO descript VALUES(0,"black");
INSERT INTO descript VALUES(0,"black");
INSERT INTO descript VALUES(0,"blue");
INSERT INTO descript VALUES(0,"a black");
INSERT INTO descript VALUES(0,"his");
INSERT INTO descript VALUES(0,"her");
INSERT INTO descript VALUES(0,"pleasant");
INSERT INTO descript VALUES(0,"the fast");
INSERT INTO descript VALUES(0,"blue");
и дальше и дальше и дальше ....
Я должен сделать это так, то в нижнем регистре, что делается с этим:
select LOWER(wordText) descript;
Как я могу идти о имея в виду самый общий ответ и отображать его? У меня есть несколько стоп-слова (что я не хочу быть включены в счет, таких как «а» или ". Как я могу идти о том, они не рассчитывали?
@ RADAR. , , Это * будет иметь гораздо больше смысла;) –