Como contar palavras em LaTeX | Counting words in LaTeX

This is a perl script that takes your .tex file as the input and returns a nice report on the number of words you have in that file. This is quite useful—and quick. You can run it from Terminal (more info on the script here).


O que exatamente deve ser contado em um documento? Notas de rodapé são incluídas? E legendas de gráficos? E títulos de seções? Referências…? O que conta como “palavra”? Palavras funcionais e lexicais, ou apenas lexicais? Números entram no cálculo…? E fórmulas matemáticas/equações? E palavras em determinadas figuras…?

Contar palavras em um documento não é algo tão simples como parece a princípio. Além disso, quando consideramos como documentos são compilados em LaTeX, existem dificuldades técnicas para realizar esse cálculo. Por essa razão, você não verá nenhuma ferramenta que “conta palavras” incluída em editores de LaTeX. O problema é que você quase sempre precisa saber o número de palavras do seu documento antes de enviá-lo a algum periódico.

Uma opção é contar as palavras do *.pdf que é compilado: há sites que fazem isso, já que nem o Adobe Pro tem essa opção. Contudo, muitos desses sites exigem o upload do seu arquivo, algo que você provavelmente não quer fazer, certo…?

A melhor saída que eu conheço está neste site. Trata-se de um script em Perl que toma como input o seu *.tex. Entre no site, baixe o script texcount.pl, e siga as instruções do manual. Caso você deseje algo mais rápido (e em português), aqui vai o passo-a-passo (via Mac).

1. Para facilitar o exemplo, jogue o script para o seu Desktop. Faça o mesmo com seu arquivo *.tex (duplique, para não precisar devolvê-lo à pasta original)
2. Entre no Terminal (ou similar, como iTerm)
3. Acesso o Desktop via terminal
4. Rode o script utilizando o seu arquivo *.tex como argumento

:cd Desktop
:Desktop ... texcount arquivo.tex

O output do script será bastante interessante e completo. Aqui vai um exemplo de output (#=número):

File: seu_arquivo.tex
Encoding:
Words in text: #
Words in headers: #
Words outside text (captions, etc.): #
Number of headers: #
Number of floats/tables/figures: #
Number of math inlines: #
Number of math displayed: #
Subcounts:
  text+headers+captions (#headers/#floats/#inlines/#displayed)
  #+#+# (#/#/#/#) Section: 

Note que o output também fornece subcounts, ou seja, contagens relativas a seções, o que é bem interessante. Pode parecer um pouco mais complexo do que o habitual, mas você tem certeza do que está sendo contado.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s