Загрузка...

Много мужских имён в .txt файле

Тема в разделе Python создана пользователем PhilipPanda 5 авг 2025 в 23:00. 57 просмотров

  1. PhilipPanda
    PhilipPanda Автор темы 5 авг 2025 в 23:00 129 28 июн 2025
    Здравствуйте, работаю с задачей:
    Есть excel таблица, я считываю и сохраняя столбец имён в .txt файл затем мне нужно отсортировать по совпадениями чтобы остались только женские имена
    Гпт несёт полную пургу(это очевидно) https://popname.ru/names есть такой сайтик, но делать парсер под него лень, вообщем поэтому создал тему )
     
  2. rasez
    rasez 5 авг 2025 в 23:01 Стим аккаунты тут - lolz.live/threads/7680775 :da: 1602 29 апр 2025
    Возьми какую то бд всех мужских имен и сделай скрипт чтоб он удалял все похожие игнорируя условно заглавные буквы гпт тебе в помощь
     
    5 авг 2025 в 23:01 Изменено
    1. Посмотреть предыдущие комментарии (1)
    2. rasez
      PhilipPanda, в ручуню допиши или нейронку пропроси это максимум что можноо сделать пока что, можешь еще скинуть гроку условному или дипсику сам файл и сказать убрать мужские имена они нормально с файлами работают. Если файл не прокнет создай репо на гитхабе закинь туда сам файл тхт и попроси из репо удалить всех мужиков
    3. rasez
      PhilipPanda, можешь файл в тг скинуть ес там ниче нету секретного попробую мб попозже
    4. PhilipPanda Автор темы
      rasez, у меня спам хаха, сможешь отписать?
  3. PhilipPanda
    PhilipPanda Автор темы 5 авг 2025 в 23:15 129 28 июн 2025
    нашёл нестандартное решение спасибо
    --- Сообщение объединено с предыдущим 5 авг 2025 в 23:22
    Решение(мало кому-то понадобится): https://github.com/wb-08/SlavicNames, папка dump/names содержит всю необходимую информацию в виде .json и есть фулл нейм/также есть подразедление на gender "male/female" я работал с names.json и вот скрипт для формирования только мужских имён, под свою задачу думаю разберетесь сами, не маленькие.
    Python
    import json
    with open('names.json', 'r', encoding='utf-8') as start, \
    open('fix.txt', 'w', encoding='utf-8') as close:
    for line in start:
    data = json.loads(line)
    if data['gender'] == 'm':
    close.write(data['text'] + '\n')
     
Top
Загрузка...