1. Друзья, в это тяжёлое и непонятное для всех нас время мы просим вас воздержаться от любых упоминаний политики на форуме, - этим ситуации не поможешь, а только возникнут ненужные ссоры и обиды. Это касается также шуток и юмора на тему конфликта. Пусть войны будут только виртуальными, а политики решают разногласия дипломатическим путём. С уважением, администрация Old-Games.RU.

    Скрыть объявление
  2. Пожалуйста, внимательно прочитайте правила раздела.
  3. Если Вы видите это сообщение, значит, вы ещё не зарегистрировались на нашем форуме.

    Зарегистрируйтесь, если вы хотите принять участие в обсуждениях. Перед регистрацией примите к сведению:
    1. Не регистрируйтесь с никами типа asdfdadhgd, 354621 и тому подобными, не несущими смысловой нагрузки (ник должен быть читаемым!): такие пользователи будут сразу заблокированы!
    2. Не регистрируйте больше одной учётной записи. Если у вас возникли проблемы при регистрации, то вы можете воспользоваться формой обратной связи внизу страницы.
    3. Регистрируйтесь с реально существующими E-mail адресами, иначе вы не сможете завершить регистрацию.
    4. Обязательно ознакомьтесь с правилами поведения на нашем форуме, чтобы избежать дальнейших конфликтов и непонимания.
    С уважением, администрация форума Old-Games.RU
    Скрыть объявление

Soft Подчистать число слов или операторов

Тема в разделе "Hard & Soft", создана пользователем Newbilius, 16 май 2012.

  1. Newbilius Программуль

    Newbilius

    Регистрация:
    24 авг 2007
    Сообщения:
    4.607
    Всем привет!

    Вопрос нетривиальный. Вот есть папка. В ней ещё несколько подкатологов разной вложенности. В них есть файлы. В том числе - txt

    Задача: подсчитать суммарное число слов во всех данных txt. Может, кто-то знает что-то подобное готово, или придётся шаманить свою программу? :)
     
  2. DKr

    DKr

    Регистрация:
    11 мар 2008
    Сообщения:
    882
    "Здравствуй, линукс" это называется. Задача уровня первокуров по программированию на баше.
     
    Bato-San нравится это.
  3. Лорд Лотар Мессир ёж

    Лорд Лотар

    Регистрация:
    12 май 2008
    Сообщения:
    5.998
    Nubilius, могу посоветовать только брутальное:
    1. Найти все *.тхт файлы
    2. Скопировать содержимое всех файлов в Microsoft Word
    3. (Главное меню) Сервис > Статистика > Количество слов.
     
  4. Newbilius Программуль

    Newbilius

    Регистрация:
    24 авг 2007
    Сообщения:
    4.607
    DKr, вот уж воистину. find+grep+чего то там ещё. Но время на изучение и написания скрипта не оправдывает, увы, затрат. быстрее что-то напрограммировать. Но вдруг (вдруг!) уже есть такие скрипты/программы и кто-то, совершенно случайно, из проходящих мимо о таких в курсе?

    ---------- Сообщение добавлено в 19:00 ---------- Предыдущее сообщение размещено в 19:00 ----------

    Лорд Лотар, я уже сам об этом подумывал, но жесть ведь =)
     
  5. Лорд Лотар Мессир ёж

    Лорд Лотар

    Регистрация:
    12 май 2008
    Сообщения:
    5.998
    Nubilius, да как сказать - если количество *.тхт файлов меньше 20-30 то вполне реально. :)
     
  6. DKr

    DKr

    Регистрация:
    11 мар 2008
    Сообщения:
    882
    На изучение баша в пределах find много времени не уйдет, особенно если сразу гуглить "найти все файлы во вложенных директориях". Кроме того "что-то напрограммировать" тоже занимает время, причем ты будешь программировать то, что уже написано профессионалами.

    Ну и поищи, конечно, место, где тусуются студенты, которым задают написание скриптов.
     
  7. Quasist

    Quasist

    Регистрация:
    11 май 2008
    Сообщения:
    841
    Последнее редактирование: 16 май 2012
    Newbilius нравится это.
  8. Newbilius Программуль

    Newbilius

    Регистрация:
    24 авг 2007
    Сообщения:
    4.607
    Quasist, Изумительно.

    Всем спасибо за советы, и прошу простить, вопрос действительно оказался очень-простым. Запара..
     
  9. INHELLER

    INHELLER

    Регистрация:
    19 май 2009
    Сообщения:
    7.228
    Nubilius > Если что, Cygwin к вашим услугам. :)
     
  10. Siberian_GRemlin

    Siberian_GRemlin

    Регистрация:
    22 ноя 2004
    Сообщения:
    4.049
    Теперь я знаю что такое «программуль».
     
    BrainRipper нравится это.
  11. Quasist

    Quasist

    Регистрация:
    11 май 2008
    Сообщения:
    841
    Учитывая, что уже есть термины "говнокодер", "индус", "кодо-обезьяна(code-monkey)" итд, то термин "программуль" не очень приживётся в центральной рф, хотя во всяких низкоИТшных ***-станах может быть фонетически фапально звучать.
     
  12. Newbilius Программуль

    Newbilius

    Регистрация:
    24 авг 2007
    Сообщения:
    4.607
    В запарке обратиться к коллективному разуму не зазорно.
     
  13. Bato-San Чеширский волк-киборг

    Bato-San

    Регистрация:
    24 июн 2010
    Сообщения:
    14.136
    А воспользоваться FAR с соответствующими плагинами не судьба ?! Всё уже есть.
     
  14. MisterGrim Very old

    MisterGrim

    Legacy

    Регистрация:
    29 ноя 2007
    Сообщения:
    25.423
    copy *.txt all.txt
     
  15. SMArt Страшила мудрый

    SMArt

    Legacy

    Регистрация:
    19 фев 2006
    Сообщения:
    2.783
    MisterGrim, они разбросаны в подпапках.
    поэтому сначала правильно будет
    Код:
    FOR /R "[путь к папке с подпапками]" %a in (*.txt) DO copy %a [временная папка]
    а уж потом то что ты написал запускать во временной папке, куда скопируются все файлы txt из подпапок.
    Кстати в UNIX есть консольная программа Word Count (wc), существует портированная версия под Windows. Гуглится легко.
     
  16. MisterGrim Very old

    MisterGrim

    Legacy

    Регистрация:
    29 ноя 2007
    Сообщения:
    25.423
    Тогда так, да.
    Или так, в один ход:
    Код:
    FOR /R "[путь к папке с подпапками]" %a in (*.txt) DO type "%a">>result.txt
    (кстати, кавычки вокруг %a обязательно нужно ставить).

    А насчёт WC у меня большие сомнения в плане его способности работать с кириллицей.
     
  17. Bato-San Чеширский волк-киборг

    Bato-San

    Регистрация:
    24 июн 2010
    Сообщения:
    14.136
    Nubilius, а каким образом определяется "слово" ? По граничным пробелам ? И в какой кодировке эти .txt ?
     
  18. DKr

    DKr

    Регистрация:
    11 мар 2008
    Сообщения:
    882
    Слово определяется по граничным символам: пробел, табуляция, знаки препинания. Очевидно же. Кодировка у тебя может быть 1251 или ср866, в обеих знаки препинания совпадают по кодам. Вроде бы. Но может запороться на длинных тире и неправильных кавычках. Короче, перегоняй все в юникод, а там wc разберется.
     
  1. На этом сайте используются файлы cookie, чтобы персонализировать содержимое, хранить Ваши предпочтения и держать Вас авторизованным в системе, если Вы зарегистрировались.
    Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie.
    Скрыть объявление