nan in bogofilter stats

Stephen Davies scldad at sdc.com.au
Wed Nov 19 00:08:25 CET 2008


Recently I am seeing large numbers of false Ham results from my well-trained 
bogofilter.

The following is the output of a bogofilter scan of an obvious spam mail.

The Ham result seems to result from the "nan" values.

Where do these come from and how do I fix it?

Cheers and thanks,
Stephen Davies


[scldad at mustang bogofilter]$ bogofilter --version
bogofilter version 1.1.6
    Database: Berkeley DB 4.6.21: (December 28, 2007) NON-TRANSACTIONAL

X-Bogosity: Ham, tests=bogofilter, spamicity=0.000000, version=1.1.6
                                        n    pgood     pbad      fw     U
  "$59.95"                           2160       nan  0.006905       nan -
  "Viagra"                          12385       nan  0.039592       nan -
  "buy"                             13387       nan  0.042795       nan -
  "childrencloud.com"                  11       nan  0.000035       nan -
  "from:Blackburn"                     23       nan  0.000074       nan -
  "from:Destin"                        11       nan  0.000035       nan -
  "from:collocationsai8"               11       nan  0.000035       nan -
  "from:tiavacams.com"                 11       nan  0.000035       nan -
  "head:Content-transfer-encoding"    1616       inf  0.003887  0.000006 +
  "head:Content-type"                   0  --------  --------  0.520000 i
  "head:Date"                      161813       nan  0.517277       nan -
  "head:From"                           0  --------  --------  0.520000 i
  "head:MIME-Version"              147105       nan  0.470259       nan -
  "head:Mail"                        2280       nan  0.007289       nan -
  "head:Message-ID"                145482       nan  0.465071       nan -
  "head:Microsoft"                  98282       nan  0.314184       nan -
  "head:MimeOLE"                    95795       nan  0.306233       nan -
  "head:Normal"                    111608       nan  0.356784       nan -
  "head:Nov"                            0  --------  --------  0.520000 i
  "head:Produced"                   96908       nan  0.309791       nan -
  "head:Status"                         0  --------  --------  0.520000 i
  "head:T8!!"                          11       nan  0.000035       nan -
  "head:V6.0.6001.18049"              589       nan  0.001883       nan -
  "head:Wed"                            0  --------  --------  0.520000 i
  "head:Windows"                     7409       nan  0.023685       nan -
  "head:X-KMail-EncryptionState"        0  --------  --------  0.520000 i
  "head:X-KMail-MDN-Sent"               0  --------  --------  0.520000 i
  "head:X-KMail-SignatureState"         0  --------  --------  0.520000 i
  "head:X-MIMEOLE"                    976       nan  0.003120       nan -
  "head:X-MSMail-priority"            730       nan  0.002334       nan -
  "head:X-Mailer"                  130528       nan  0.417266       nan -
  "head:X-Priority"                116917       nan  0.373755       nan -
  "head:X-Status"                       0  --------  --------  0.520000 i
  "head:X-UIDL"                     17414       nan  0.055668       nan -
  "head:X-Virus-Scanned"            23900       nan  0.076402       nan -
  "head:amavisd-new"                23214       nan  0.074210       nan -
  "head:bit"                        67432       nan  0.215564       nan -
  "head:charset"                    70412       nan  0.225090       nan -
  "head:collocationsai8"                5       nan  0.000016       nan -
  "head:flowed"                     17461       nan  0.055819       nan -
  "head:format"                     17403       nan  0.055633       nan -
  "head:hnP!!S"                        11       nan  0.000035       nan -
  "head:iso-8859-1"                     0  --------  --------  0.520000 i
  "head:original"                   13479       nan  0.043089       nan -
  "head:plain"                      52824       nan  0.168866       nan -
  "head:reply-type"                 13580       nan  0.043412       nan -
  "head:sdc.com.au"                 26556       nan  0.084893       nan -
  "head:text"                       75118       nan  0.240134       nan -
  "head:tiavacams.com"                  5       nan  0.000016       nan -
  "http"                           224709       nan  0.718340       nan -
  "now"                             42561       inf  0.126982  0.000000 +
  "pills"                           10378       nan  0.033176       nan -
  "rcvd:ESMTP"                          0  --------  --------  0.520000 i
  "rcvd:Nov"                        22848       nan  0.073040       nan -
  "rcvd:Wed"                        19712       nan  0.063014       nan -
  "rcvd:andrada"                       11       nan  0.000035       nan -
  "rcvd:for"                        61212       nan  0.195680       nan -
  "rcvd:forged"                      8385       nan  0.026805       nan -
  "rcvd:from"                      119609       nan  0.382361       nan -
  "rcvd:may"                         8386       nan  0.026808       nan -
  "rcvd:mustang.sdc.com.au"             0  --------  --------  0.520000 i
  "rcvd:scldad"                         0  --------  --------  0.520000 i
  "rcvd:sdc.com.au"                 59654       nan  0.190699       nan -
  "rcvd:with"                       76798       nan  0.245505       nan -
  "rtrn:collocationsai8"               11       nan  0.000035       nan -
  "rtrn:tiavacams.com"                 11       nan  0.000035       nan -
  "subj:$89.95"                        96       nan  0.000307       nan -
  "subj:Price"                        438       nan  0.001400       nan -
  "subj:Sildenafil"                   687       nan  0.002196       nan -
  "subj:Viagra"                      3559       nan  0.011377       nan -
  "subj:for"                        17960       nan  0.057414       nan -
  "subj:pills"                       3815       nan  0.012196       nan -
  "to:scldad"                      150032       nan  0.479616       nan -
  "to:sdc.com.au"                  279676       nan  0.894056       nan -
  "url:89"                           2872       nan  0.009181       nan -
  "url:89.165"                         25       nan  0.000080       nan -
  "url:89.165.243"                     11       nan  0.000035       nan -
  "url:89.165.243.217"                 11       nan  0.000035       nan -
  N_P_Q_S_s_x_md                        2  1.000000  0.000000  0.000000
                                           0.017800  0.520000  0.375000

[scldad at mustang bogofilter]$ bogoutil -w wordlist.db Viagra
                                 spam   good
Viagra                          12385      0

-- 
=============================================================================
Stephen Davies Consulting P/L                             Voice: 08-8177 1595
Adelaide, South Australia.                                Fax  : 08-8177 0133
Computing & Network solutions.                            Mobile:040 304 0583
                                          VoIP:sip:1132210 at sip1.bbpglobal.com



More information about the Bogofilter mailing list