Quantcast
Channel: 源码库
Browsing all 50 articles
Browse latest View live

Web爬虫:JoBo

JoBo是一个用于下载整个Web站点的简单工具。它本质是一个WebSpider。与其它下载工具相比较它的主要优势是能够自动填充form(如:自动登录)和使用cookies来处理session。JoBo还有灵活的下载规

View Article



Web爬虫:LARM

LARM能够为JakartaLucene搜索引擎框架的用户提供一个纯Java的搜索解决方案。它包含能够为文件,数据库表格建立索引的方法和为Web站点建索引的爬虫。

View Article

Web爬虫:Arachnid

Arachnid:是一个基于Java的webspider框架.它包含一个简单的HTML剖析器能够分析包含HTML内容的输入流.通过实现Arachnid的子类就能够开发一个简单的Webspiders并能够在Web站上的每个页面被解析之后

View Article

Web爬虫:spindle

spindle是一个构建在Lucene工具包之上的Web索引/搜索工具.它包括一个用于创建索引的HTTPspider和一个用于搜索这些索引的搜索类。spindle项目提供了一组JSP标签库使得那些基于JSP的站点不需要

View Article

Web爬虫:J-Spider

J-Spider:是一个完全可配置和定制的WebSpider引擎.你可以利用它来检查网站的错误(内在的服务器错误等),网站内外部链接检查,分析网站的结构(可创建一个网站地图),下载整个Web站点,你还

View Article


Web爬虫:Arale

Arale主要为个人使用而设计,而没有像其它爬虫一样是关注于页面索引。Arale能够下载整个web站点或来自web站点的某些资源。Arale还能够把动态页面映射成静态页面。

View Article

Web爬虫:WebLech

WebLech是一个功能强大的Web站点下载与镜像工具。它支持按功能需求来下载web站点并能够尽可能模仿标准Web浏览器的行为。WebLech有一个功能控制台并采用多线程操作。

View Article

Web爬虫:Heritrix

Heritrix是一个开源,可扩展的web爬虫项目。Heritrix设计成严格按照robots.txt文件的排除指示和METArobots标签。

View Article


Web爬虫:WebSPHINX

WebSPHINX是一个Java类包和Web爬虫的交互式开发环境。Web爬虫(也叫作机器人或蜘蛛)是可以自动浏览与处理Web页面的程序。WebSPHINX由两部分组成:爬虫工作平台和WebSPHINX类包。

View Article


EAI/ESB组件:WSO2 ESB

WSO2ESB是一套轻量级,以XML和Webservice为核心的ESB(EnterpriseServiceBus)。基于ApacheSynapse和ApacheAxis2项目构建。它支持connectivity,transformation,mediation和Webservice交互管理。

View Article

EAI/ESB组件:Apache Synapse

ApacheSynapse一个易于使用、轻量级的XML与WebServices管理和集成中间件。可用于搭建SOA和ESB的基础平台。ApacheSynapse支持多种标准包括:XML、XSLT、XQuery、XPath、SOAP、POX/REST、HTTP/S、JMS、、FTP、

View Article

EAI/ESB组件:JBossESB

ESB是SOA基础架构的一部分,而SOA并不是一种简单的技术或产品。它是一种设计风格,包含无关于实际技术的多个方面。JBossESB能够把抽象的SOA设计映射成具体实现。它特性包括:支持大部

View Article

EAI/ESB组件:jeeESB

现今SOA在企业应用程序开发中是一个比较迷惑的词语。SOA的核心是WebServices。通过Webservice就能够实现SOA。Jee(G)ESB是Java企业服务总线的一个开源实现,通过简单的XML配置就能够实现SOAP)W

View Article


EAI/ESB组件:OpenESB

OpenESB项目实现了一个运行期企业服务总线(Enterprise Service Bus:ESB)使用JBI(Java业务集成)作为核心基础。OpenESB可以让你集成企业应用与Web Service松散地连接成复合的应用程序。这使得你可以无

View Article

EAI/ESB组件:OpenSyncro

OpenSyncro是一个轻量级,开源企业应用集成工具。它运行在Apache Tomcat服务器上并把它的配置信息存储在MySQL数据库中.它的特性包括内嵌数据转换器能够把CSV表格和其它基于文本的数据格式

View Article


EAI/ESB组件:Celtix

Celtix提供了一个运行期Java企业服务总线和一组可扩展的API.通过使用一个基于标准的,面向服务的体系来简化商业与技术组件的构建,集成和灵活重复使用。

View Article

EAI/ESB组件:OpenQueue

OpenQueue是一个用于发布与订阅消息队列的开放协议。这使得运行在不同机器上的,采用不同语言开发的且没有联系的应用程序之间能够进行异步通信。

View Article


EAI/ESB组件:Mule

Mule是一个企业服务总线(ESB)消息框架.它的主要特性包括: 1.基于J2EE1.4的企业消息总线(ESB)和消息代理(broker). 2.可插入的连接性:比如Jms,jdbc,tcp,udp,multicast,http,servlet,smtp,pop3, file,xmpp等. 3.支持

View Article

EAI/ESB组件:ServiceMix

ServiceMix是一个建立在JBI (JSR 208)语法规则和APIs上的开源ESB(Enterprise Service Bus:企业服务总线)。它包括一个完整的JBI容器,其主要是由标准化信息服务和路由器,JBI管理MBeans,JBI配置单元和

View Article

EAI/ESB组件:elemenope

elemenope是一个企业应用集成(EAI),面向服务架构(SOA)的消息框架.它使用JMS作为消息接发并且当前利用IBM MQSeries [WebSphereMQ]作为MOM[Message Oriented Middleware].elemenope还内置大型主机连接类用于当利

View Article
Browsing all 50 articles
Browse latest View live




Latest Images