[6주차 총정리] pd.Series 특정 문자 포함 여부 확인/ 개수 Count (pd.Series.str.contains()/ str.count())
1. pd.Series.str.contains('문자') # 텍스트 피쳐 벡터라이징 countvectorizer # okt로 토큰화된 데이터 그대로 사용 count_vec = CountVectorizer(tokenizer = lambda x:x, lowercase=False) count_X = count_vec.fit_transform(df['Text_token']) count_sim = cosine_similarity(count_X, count_X) print(count_sim) # 텍스트 간의 코사인 유사도 따지기 count_sim_sorted_ind = count_sim.argsort()[:, ::-1] def find_place(df, sorted_ind, top_n=10): data = inpu..