nan in bogofilter stats
Stephen Davies
scldad at sdc.com.au
Wed Nov 19 00:08:25 CET 2008
Recently I am seeing large numbers of false Ham results from my well-trained
bogofilter.
The following is the output of a bogofilter scan of an obvious spam mail.
The Ham result seems to result from the "nan" values.
Where do these come from and how do I fix it?
Cheers and thanks,
Stephen Davies
[scldad at mustang bogofilter]$ bogofilter --version
bogofilter version 1.1.6
Database: Berkeley DB 4.6.21: (December 28, 2007) NON-TRANSACTIONAL
X-Bogosity: Ham, tests=bogofilter, spamicity=0.000000, version=1.1.6
n pgood pbad fw U
"$59.95" 2160 nan 0.006905 nan -
"Viagra" 12385 nan 0.039592 nan -
"buy" 13387 nan 0.042795 nan -
"childrencloud.com" 11 nan 0.000035 nan -
"from:Blackburn" 23 nan 0.000074 nan -
"from:Destin" 11 nan 0.000035 nan -
"from:collocationsai8" 11 nan 0.000035 nan -
"from:tiavacams.com" 11 nan 0.000035 nan -
"head:Content-transfer-encoding" 1616 inf 0.003887 0.000006 +
"head:Content-type" 0 -------- -------- 0.520000 i
"head:Date" 161813 nan 0.517277 nan -
"head:From" 0 -------- -------- 0.520000 i
"head:MIME-Version" 147105 nan 0.470259 nan -
"head:Mail" 2280 nan 0.007289 nan -
"head:Message-ID" 145482 nan 0.465071 nan -
"head:Microsoft" 98282 nan 0.314184 nan -
"head:MimeOLE" 95795 nan 0.306233 nan -
"head:Normal" 111608 nan 0.356784 nan -
"head:Nov" 0 -------- -------- 0.520000 i
"head:Produced" 96908 nan 0.309791 nan -
"head:Status" 0 -------- -------- 0.520000 i
"head:T8!!" 11 nan 0.000035 nan -
"head:V6.0.6001.18049" 589 nan 0.001883 nan -
"head:Wed" 0 -------- -------- 0.520000 i
"head:Windows" 7409 nan 0.023685 nan -
"head:X-KMail-EncryptionState" 0 -------- -------- 0.520000 i
"head:X-KMail-MDN-Sent" 0 -------- -------- 0.520000 i
"head:X-KMail-SignatureState" 0 -------- -------- 0.520000 i
"head:X-MIMEOLE" 976 nan 0.003120 nan -
"head:X-MSMail-priority" 730 nan 0.002334 nan -
"head:X-Mailer" 130528 nan 0.417266 nan -
"head:X-Priority" 116917 nan 0.373755 nan -
"head:X-Status" 0 -------- -------- 0.520000 i
"head:X-UIDL" 17414 nan 0.055668 nan -
"head:X-Virus-Scanned" 23900 nan 0.076402 nan -
"head:amavisd-new" 23214 nan 0.074210 nan -
"head:bit" 67432 nan 0.215564 nan -
"head:charset" 70412 nan 0.225090 nan -
"head:collocationsai8" 5 nan 0.000016 nan -
"head:flowed" 17461 nan 0.055819 nan -
"head:format" 17403 nan 0.055633 nan -
"head:hnP!!S" 11 nan 0.000035 nan -
"head:iso-8859-1" 0 -------- -------- 0.520000 i
"head:original" 13479 nan 0.043089 nan -
"head:plain" 52824 nan 0.168866 nan -
"head:reply-type" 13580 nan 0.043412 nan -
"head:sdc.com.au" 26556 nan 0.084893 nan -
"head:text" 75118 nan 0.240134 nan -
"head:tiavacams.com" 5 nan 0.000016 nan -
"http" 224709 nan 0.718340 nan -
"now" 42561 inf 0.126982 0.000000 +
"pills" 10378 nan 0.033176 nan -
"rcvd:ESMTP" 0 -------- -------- 0.520000 i
"rcvd:Nov" 22848 nan 0.073040 nan -
"rcvd:Wed" 19712 nan 0.063014 nan -
"rcvd:andrada" 11 nan 0.000035 nan -
"rcvd:for" 61212 nan 0.195680 nan -
"rcvd:forged" 8385 nan 0.026805 nan -
"rcvd:from" 119609 nan 0.382361 nan -
"rcvd:may" 8386 nan 0.026808 nan -
"rcvd:mustang.sdc.com.au" 0 -------- -------- 0.520000 i
"rcvd:scldad" 0 -------- -------- 0.520000 i
"rcvd:sdc.com.au" 59654 nan 0.190699 nan -
"rcvd:with" 76798 nan 0.245505 nan -
"rtrn:collocationsai8" 11 nan 0.000035 nan -
"rtrn:tiavacams.com" 11 nan 0.000035 nan -
"subj:$89.95" 96 nan 0.000307 nan -
"subj:Price" 438 nan 0.001400 nan -
"subj:Sildenafil" 687 nan 0.002196 nan -
"subj:Viagra" 3559 nan 0.011377 nan -
"subj:for" 17960 nan 0.057414 nan -
"subj:pills" 3815 nan 0.012196 nan -
"to:scldad" 150032 nan 0.479616 nan -
"to:sdc.com.au" 279676 nan 0.894056 nan -
"url:89" 2872 nan 0.009181 nan -
"url:89.165" 25 nan 0.000080 nan -
"url:89.165.243" 11 nan 0.000035 nan -
"url:89.165.243.217" 11 nan 0.000035 nan -
N_P_Q_S_s_x_md 2 1.000000 0.000000 0.000000
0.017800 0.520000 0.375000
[scldad at mustang bogofilter]$ bogoutil -w wordlist.db Viagra
spam good
Viagra 12385 0
--
=============================================================================
Stephen Davies Consulting P/L Voice: 08-8177 1595
Adelaide, South Australia. Fax : 08-8177 0133
Computing & Network solutions. Mobile:040 304 0583
VoIP:sip:1132210 at sip1.bbpglobal.com
More information about the Bogofilter
mailing list