`
linliangyi2007
  • 浏览: 1003873 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论
文章列表
最新版IKAnalyzer 3.0已发布,详细请浏览:http://linliangyi2007.iteye.com/blog/429960 客户词典扩展API,补充说明: 类 : org.mira.lucene.analysis.dict.Dictionary 方法 :public static void loadExtendWords(List wordList) (PS:实际上该API一直存在于v2.0.2,都怪俺没 ...
Java内存控制问题     正如大多数人所知,Java语言对内存回收是通过GC进行的,这与C++不同。     在C++中,通过new操作创建的内存空间要求程序员通过delete操作回收,如果不回收就会发生内存泄露。     在Java中,虚拟机采用有向图结构监视内存中的所有对象(即,用一张有向图将对象的引用关联成一张网)。只要通过有向图能查找到的对象,虚拟机都认为引用有效。而有向图访问不到的对象,JVM会认为是无用的,会进行回收。因此Java不存在像C++中的孤立对象的内存泄露。     Java中的内存泄露是指那些存在可访问的引用,却不再使用的对象。虚拟机不会回收,但内存会一直占用。这种 ...
关于HTTP协议的图片传输注意事项   在编写Http servlet 时,有时要用到 HttpServletResponse 返回动态生成的图片信息。此时,务必注意Http response head中两个属性的设置,一个是contentType,一个是contentLength。       正确的设置contentType属性,能保证不同厂商各个浏览器访问明确放回的信息是一个图像,而不是其它的二进制流,否则可能出现乱码显示或者提示用户下载二进制文件图像请求时不出现链接超时异常。       标识contentLength属性能告诉浏览器,图像的具体大小,IO流到什么位置结束,否则在一些 ...
一.TreeSet 、 TreeMap 时间复杂度: log(n) 方法一: 对存入TreeSet的对象和put到TreeMap的key实现java.util.Comparable接口 代码样例: public class TokenDelegate implements Comparable{ //词元的起始位移 private int offset; //词元的起始位置 private int begin; //词元的终止位置 private int end; ...... ...... /* ...
IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的 正反向全切分 以及 正反向最大匹配切分 两种算法,是Lucene Analyzer接口的实现,代码使用例子如下:下载地址:Lucene中文分词器 V1.2 CSDN下载Lucene中文分词器 V1.2 Google下载正反向全切分算法:实现类 : org.mira.lucene.analysis.IK_CAnalyzer分词效果测试,命令行如下:java -classpath IKAnalyzer.jar;lucene-core-2.0.0.jar org.mira.lucene.analysis.IK_CAna ...
Global site tag (gtag.js) - Google Analytics