`
linliangyi2007
  • 浏览: 1002989 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论
文章列表
【引言】 在天涯上看到有人发帖,也在Iteye上看到相同论调,本人对某些人所谓的“库存”难题的思路不以为然,对此,鄙人给出个算法模型,献丑,只为打某些人的脸! 一下是iteye上一篇文章提出的问题 引用好了,讲了这半天淘宝,可以说12306了吧? 我以北京西到深圳北的G71次高铁为例(这里只考虑南下的方向,不考虑深圳北到北京西的,那是另外一个车次,叫G72),它有17个站(北京西是01号站,深圳北是17号站),3种座位(商务、一等、二等)。表面看起来,这不就是3个商品吗?G71商务座、G71一等座、G71二等座。大部分轻易喷12306的技术人员(包括某些中等规模公司的专家、CTO)就是在这里 ...
2013年1月9号,一个平凡而又不平常的日子! IK中文分词开源项目在历经六个年头的发展,迈入第七个年头时,迎来的它的第一笔捐赠! 感谢来自广州的热心支持者Andy!!!作为一名开源项目的个人用户及捐赠者,您的慷慨善举 对于IK,甚至对于广大的国内开源项目的发起者而言,都是莫大的肯定与鼓舞!! 笔者本人并不清楚国内(个人发起的)开源项目中有多少是已经得到捐赠的。国内的开源用户 群体中,又有多少是曾经给予过您使用的开源项目以捐赠的。 写这个博客的目的就是在告诉大家,我们为之期待和努力的开源社区氛围正在形成,一切都在 悄然改变。有志于开源的兄弟姐妹们,行动起来吧!!不论你们是用户,还是 ...
首先感谢大家对IK分词器的关注。 最近一段时间正式公司事务最忙碌的时候,Lucene4.0和Solr4.0发布后,便收到了广大网友的大量邮件要求更新版本,这让我既开心又感到鸭梨大啊~~ 花了3天时间,了解了Lucene4.0和solr 4.0与分词相关部分的源码。果然,又是一次不兼容的修订啊~~ 时间紧迫的推出了IK Analyzer 2012 FF版本 (你问啥是FF,其实就是For 4.0),在API和功能上保持不变,只是让其支持了Lucene4.0和Solr4.0,让这部分的用户能用起来。 如果你还是Lucene3.2-3.6的用户,那么你只需要下载IK Analyzer 2012 ...
新版本改进: 支持分词歧义处理 支持数量词合并 词典支持中英文混合词语,如:Hold住 IK Analyzer 2012特性 采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式; 在系统环境:Core2 i7 3.4G双核,4G内存,window 7 64位, Sun JDK 1.6_29 64位 普通pc环境测试,IK2012具有160万字/秒(3000KB/S)的高速处理能力。 2012版本的智能分词模式支持简单的分词排歧义处理和数量词合并输出。 采用了多子处理器分析模式,支持:英文字母、数字、中文词汇等分词处理,兼容韩文、日文字符 优化的词典存储,更小的内 ...
之前有在CSDN注册过的兄弟们,注意了。。。 如果你的邮箱,以及其他账户用的密码和CSDN上的一致,请赶快修改!! 看到新闻的兄弟们帮顶了.... 新闻地址 : http://tieba.baidu.com/f?kz=1332938478
第一眼看着相当给力,不敢说跟国际大公司比,不过在福州这个小地方还是不错滴~~ 关键在于办公氛围比一般的企业来的轻松,惬意啊! 废话不多说,上图咯~~~~~~~~~~~ 进门第一眼 接待室 台球室 网游体验区 液晶屏还木有摆上来啊~~~~ 影音棚 餐厅 看到左上角的柜式冰箱了吗?腾讯赠的,传说有免费的饮料~~ 茶水间 分布在公司各处的茶水间之一。 看到了一台咖啡机,不过,貌似国人很少自己煮咖啡豆吧!
故事的背景:      笔者最近在做一个类SNS的项目,其中使用了MongoDB进行Feed信息存储,并使用定时器删除过期信息。      定时器的时间变量为60天,设定 private long msgInvalidDue = 60 * 24 * 3600 * 1000; 之所以这么写常量,完全是为了代码的易读易维护。    故事的发生:      在项目上线的某天,突然发现,2周前的数据丢失了,遍历了程序,没发现逻辑问题,甚至开始当心MongoDB造成的数据丢失(业内也是发生过的)。 笔者当时纠结啊~~     但第二天又发现数据的丢失是持续而且有规律的,于 ...
博主评: 这片博客很短,很给力,转载过来,作为收藏 一个朋友,在一家软件的大企业做了十年的软件研发,想出来创业,问我要注意什么。我开玩笑说,要想成功,必须学习互联网创业的“葵花宝典”,第一条就是“挥刀 ...
炎热小镇的午后,太阳高挂。每个人都债台高筑,无精打彩。一位游人在镇上一家汽车旅馆停车,拿出一叠1000元钞票放在柜台,想挑一间合适的房间过夜。在该先生上楼看房时,店主抓起这叠1000元钞,跑到隔壁屠户那支付了他欠的肉钱。屠夫拿1000元钱横过马路付清了欠猪农的的猪钱。猪农拿了1000元奔向饲料和燃料供应商。分别付清了欠款。供应商拿到1000元赶忙付清了他召妓的钱。有了1000元,这名ji女(居然是je的敏感词哈哈)到旅馆付了她所欠的房钱。店主把这1000元又放回柜台时,恰巧那游客慢慢走下楼来收起那1000元钞票塞进口袋,声称没一间房满意,驾车走了。这一会儿看起来,没有人生产什么,也没有人消费什么 ...
关于Luci-mint 服务器硬件环境 目前搜索中心仅使用一台PC Server CPU Intel(R) Xeon(R) CPU  E5520 (4核 8线程 、8M Cache) *  2 内存 24G 硬盘 IBM SCSI 硬盘 * 3  RAID5模式 服务器软件系统环境 操作系统 Red Hat AS 5.5 应用服务器 Resin Pro 3.1.9 JAVA ...
各大搜索引擎产商都鼓吹自己最理解中文,笔者做了个一个比较搞笑的测试,有图有真相,大家自己看吧,哈哈哈! 谁能“读懂”中文,抽出其中的核心语义词,一目了然啊!拜google大神,顶sogou国产(还需努力)! 谁敢说这个是软文,自己上网测试去,嘿嘿嘿! -----------------华丽的分割线------------------------- -----------------华丽的分割线------------------------- -----------------华丽的分割线-------------------------
笔者我在准备写这个议题的时候,其实觉得很可笑,这么简单的事对长年从事IT的人来说应该不难的,但是,确实落了笑话的~~听笔者慢慢道来(哈哈) 故事背景:俺家MM要给她家的小表弟重装系统了,于是乎,向公司的网管考了份winXP ghost的iso文件,心想,本本有刻录功能,回家随时可以刻光盘,没当回事~~ 故事开始:这天晚上,MM说明天要去小表弟家了,于是开始刻录。插入空光盘,win7就提示刻录向导,第一遍下来,挺快~~~ 结果,放电脑上一看,居然把iso文件包整个copy到光盘中去了,差点没吐血~~ 故事发展:上网差win7如何刻iso,结果满眼都是使用“xx刻录软件”,“xx破解版,绝对兼 ...
最新更新包V1.1.5已经发布 前言 关于LuciMint的诞生, 笔者觉得有必要说明一下。首先它不是一个开源项目,而只是笔者在工作过程中,总结出的一个工具包,因此,第一,它暂时不开源(代码还处于优化修改期),第二,它的功 ...
IK Analyzer 3.2.8版本修订 1.优化了英文字符处理,支持如:C++ 等带符号单词输出 2.简化了数词处理,使输出结果更符合用户观感 3.改进了最大词长切分,使输出结果更符合用户观感 4.性能优化,目前IK分词器的速度为约85万字/秒(16 ...
XML解析过程中,常遇见CDATA中存在非法字符,尤其在火星文盛行的当下,论坛数据五花八门,令哥蛋疼,采用如下简单处理: String EMPTY_STRING = ""; public static String regularizeXmlString(String strInput){ if(strInput == null || strInput.length() == 0){ return EMPTY_STRING; } String result = strInput.replaceAll("[\\x00-\\x08|\\ ...
Global site tag (gtag.js) - Google Analytics