Hello,<br>&nbsp;&nbsp; That should be fine.&nbsp; But in revision <span id="st" name="st" class="st">5918 it looks like it is intentional that the Bayesian filter runs first.<br><br>--Paul<br></span><br><div><span class="gmail_quote">On 11/30/07, 
<b class="gmail_sendername">Oscar Renalias</b> &lt;<a href="mailto:oscar@renalias.net">oscar@renalias.net</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
So can this issue be closed by placing the Bayesian filter at the end<br>of the pipeline chain?<br><br>On Nov 30, 2007, at 6:48 AM, Jon Daley wrote:<br><br>&gt; On Fri, 30 Nov 2007, Mark Wu wrote:<br>&gt;&gt; Why can&#39;t we just put the bayesian filter in last order? it seems
<br>&gt;&gt; solve this<br>&gt;&gt; problem easier.<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Does that fix everything?&nbsp;&nbsp;It is certainly the easiest (coding and<br>&gt; performance) wise.<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; With my thinking it seems like that fixes it - at least for now,
<br>&gt; because we don&#39;t have any other plugins that would use the inputs of<br>&gt; others.&nbsp;&nbsp;And we can maybe do Mark&#39;s priority idea if we ever need<br>&gt; that sort of thing.<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; As long as it works for Paul&#39;s stuff, I think that sounds good. So,
<br>&gt; then we should take Mark&#39;s rev 6088 or whatever it is and use that,<br>&gt; but modify it to pass in the previouslyRejected flag, and then put<br>&gt; the bayesian at the end.<br>&gt;<br>&gt;&gt; BTW,&nbsp;&nbsp;most lifetype installations in CJK site does rely on Bayesian
<br>&gt;&gt; Filter to protect the spam attack. Because the tokenize algorithm<br>&gt;&gt; can&#39;t separate CJK into each atomic token. We don&#39;t use stop words<br>&gt;&gt; and &quot;white space&quot; to seperate a paragraph into &quot;word&quot;.
<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; I am not sure what you are saying.&nbsp;&nbsp;It seems like you are saying<br>&gt; the tokenizer doesn&#39;t work, so then it seems that the bayesian<br>&gt; filter wouldn&#39;t be very good at all...<br>&gt;<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Well, it&#39;s been 10 minutes since I read your idea of simply putting
<br>&gt; the bayesian filter at the end, and haven&#39;t come up with a reason<br>&gt; why it won&#39;t work.&nbsp;&nbsp;So, probably good.&nbsp;&nbsp;Do you want to do it, or me?<br>&gt;<br>&gt; --<br>&gt; Jon Daley<br>&gt; <a href="http://jon.limedaley.com/">
http://jon.limedaley.com/</a><br>&gt;<br>&gt; Whenever people agree with me I always feel I must be wrong.<br>&gt; -- Oscar Wilde_______________________________________________<br>&gt; pLog-svn mailing list<br>&gt; <a href="mailto:pLog-svn@devel.lifetype.net">
pLog-svn@devel.lifetype.net</a><br>&gt; <a href="http://limedaley.com/mailman/listinfo/plog-svn">http://limedaley.com/mailman/listinfo/plog-svn</a><br><br>_______________________________________________<br>pLog-svn mailing list
<br><a href="mailto:pLog-svn@devel.lifetype.net">pLog-svn@devel.lifetype.net</a><br><a href="http://limedaley.com/mailman/listinfo/plog-svn">http://limedaley.com/mailman/listinfo/plog-svn</a><br></blockquote></div><br>