Questo è un supplemento alla risposta di @Dennis delle 18:06 del 30 luglio 2012. Sicuramente affronta il caso più difficile.
Nel caso più semplice in cui la filigrana è un testo semplice e disadorno, per esempio
Smedley For Commissioner
le filigrane PDF non compresse potrebbero essere definite così:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
dove 75.96
è l'offset orizzontale e 625
l'offset verticale per questa particolare istanza di filigrana. (Sì, sia numeri reali che interi possono essere visti.)
Una regexp come la seguente funzionerà per tutti questi watermark, ignorando qualsiasi variazione nel loro posizionamento:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Siate consapevoli, però, che una varietà di operatori PDF di modifica può entrare in gioco con filigrane che hanno una formattazione più complicata. Tale fantasia può trasformare ciò che il lettore si aspetta (spera?) di essere una stringa contigua, facilmente ricercabile, in un pasticcio di zuppa di alfabeti. Per esempio,
E1 = mc² di Smedley™
Potrebbe essere il prodotto di questo:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
… o molto peggio se la tua filigrana è a colori!
Avendo notato tutto questo, noterò anche che PDFtk ha una versione GUI che pretende di gestire i watermark, a fronte di una tassa di licenza di 4 dollari. Per niente caro!
D'altra parte, trovo che il suo sito web attualmente pubblicizza il pieno supporto per i sistemi operativi fino a Windows 8
e OS X 10.8 Mountain Lion
. Quell'annata è di oltre 4 anni fa. PDFtk potrebbe essere superato? Sospetto di no, ma non lo so.