Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как найти ключевые слова в тексте одного столбца DataFrame?

ПрограммированиеData science+3
Анонимный вопрос
Data Science
  · 14,0 K
Программист. ML, DataSience, Python  · 6 мая 2022
Например, у нас есть такой датафрейм:
df = pd.DataFrame(data={'eng': ['one', 'two', 'three'],
                        'jap': ['ichi', 'ni', 'san']},
                        columns=['eng','jap'])
Просто найти значения можно преобразовав столбец в список.
for item in df.eng.to_list():
    if 'on' in item:
        print(item)
Но лучше найти строки для которых с столбце есть ключевые слова.
Сделать это можно при помощи метода .str.contains
df[df.eng.str.contains('on')]
В примере строки вместо списков. Ключевые слова найти можно аналогично.
1 эксперт согласен
Python-разработчик и data scientist в компании KeyHabits.  · 6 мая 2022
Один способов — использование функции contains. Рассмотрим простой пример.  Для начала сформируем список из 100 словарей с ключом text, значение которого выбирается случайно из вариантов 'добрый день', 'здравствуйте', 'привет' и 'приветствую'. После этого из полученного списка создадим датафрейм pandas: import random import pandas texts = [ 'добрый день', 'здра... Читать далее
Мой текущий проект: kpmi.ru — профориентация методами искусственного интеллекта.Перейти на kpmi.ru