当前位置:首页>软件介绍>Infobright基于MySQL的数据仓库 查询:
     
Infobright基于MySQL的数据仓库

        Infobright是基于MySQL的~但不装MySQL亦可~因为它本身就自带了一个。MySQL可以粗分为逻辑层和物理存储引擎~infobright主要实现的就是一个存储引擎~但因为它自身存储逻辑跟关系型数据库根本不同~所以~它不能像InnoDB那样直接作为插件挂接到MySQL~它的逻辑层是MySQL的逻辑层加上它自身的优化器。  

        一、技术概况 

        Infobright进行复杂的查询时~通过其专利的知识网格,KnowledgeGrid,和综合优化技术~能够实现优异的性能表现。数据在导入Infobright之后将被高度压缩并以‚数据块,DataPack,?的形式存储~于此同时~知识网格会自动创建一个非常紧凑的元数据~其中包含了统计数据和数据块之间的关系信息。因此当接收到查询时~Infobright查询优化器可以通过元数据智能的决定哪些数据块与查询请求相关~并将之解压。基于知识网格技术~Infobright不需要专门对数据进行划分~也不需要建立索引~从而节省查询处理时间~提升响应速度。 

        基于列的数据架构Infobright实施、管理非常简便~不需要人工调试、数据分区和创建索引~有效的降低了管理成本~此外Infobright不需要运行在特殊的专用硬件上~同时它的数据压缩比很高,10:1—40:1,~比任何其他数据仓库系统对存储设备的占用都小。这些特性让Infobright为企业IT部门降低了预算上的负担。 

        二、功能 

        Infobright企业版——分析型高性能数据仓库 

        在随时在线的今天~需要进行业务分析的数据规模惊人增长。商业决策需依托海量数据的实时访问~企业才能保证正确方向。 

        Infobright是一个基于独特的专利知识网格技术的列式数据库~能够降低您90%的管理工作量。使用Infobright不需要创建特殊的数据库模式~无需创建和维护索引~无需对数据进行分区~甚至不需要手动调整~知识网格就会在原始数据导入时~自动创建和维护数据~并用以优化每一个查询。在一台PC服务器上~Infobright企业版在对50TB甚至更多数据量进行多并发复杂查询时~能够显示出令人惊叹的速度~相比于MySQL~其查询速度提升了数倍甚至数十倍。在同类产品中~Infobright的单机性能处于领先地位。 

        三、高数据压缩比 

        1.行业领先的数据压缩技术 

        如果您的系统数据量每天都在快速增长~受限于磁盘的容量与传输速率~您进行备份的成本与时间将快速增加~直至您无法承受。幸运的是~软件技术的发展速度超越了磁盘数据传输技术的发展速度~Infobright可以将数据以10:1至40:1的比率压缩~通过知识网格与列式架构的结合~极大的提升了查询响应速度~并降低了存储成本。通过列式架构和超压缩算法~10TB的原始数据在Infobright中将被压缩至1TB~对某些类型的数据~最高可以达到40:1的压缩率。并且Infobright压缩的速度非常快~目前已经可以以每小时1TB甚至更快的速度向Infobright导入数据~从而让您的数据仓库系统接近‚实时?工作的状态。 

        如果您的企业正苦于应对剧增的数据规模、增长的客户需求以及较高的用户期望~同时优化IT投入~Infobright先进的数据库技术就可能帮助到您。让您的IT团队能专注于快速完成业务交付而非基础架构~才能创造更大商业价值。 

        2.MySQL整合 

        Infobright是基于MySQL开发的分析型数据库~MySQL原有用户可以通过Infobright得到理想的数据仓库解决方案~它使用MySQL用户熟悉的界面~对基于MySQL开发的应用不需要进行改动~就可以无缝升级到Infobright。与MySQL相兼容的BI工具及ETL工具~Infobright都能完美支持。 

        三、技术特性 

        SQL支持全面支持ANSISQL-92标准和SQL-99扩展标准中VIEW和存储过程的部分 

        1.灵活的schema支持。支持所有schema设计, 

        2.行业标准接口。 

        支持标准数据库接口~包括ODBC、JDBC和本地连接, 

        3.API接口支持支持的API接口包括C、C++、C#、

        BorlandDelphi(viadbExpress)、Eiffeel、SmallTalk、Java(withanativeJavadriverimplementation),Lisp,Perl,PHP,Python,Ruby,REALbasic,FreeBasic,andTcl, 

        4.DML支持。支持DML语句,Insert、Update、Delete 

        5.并发用户数。支持至多500个数据库用户~32个并发查询,视CPU核心数与内存大小而定 

        6.操作系统支持。WindowsServer2003/2008(64-bit,32-

        bit),Solaris10(64-bit),RedHatEnterpriseLinux5(64-

        bit),NovellSUSELinuxEnterprise10,RedHatEnterpriseLinux5Advanc

        edServer(64-bit),Debian‘Lenny’(64-bit),orCentOS5.2(64-bit) 

        7.处理器支持。最少4G内存的Intel和AMDx86架构服务器,建议16G内存或更多, 

        8.数据导入方式支持。Infobright企业版支持两种数据导入方式。通过文本方式向MySQL中导入~或通过文本和二进制文件的方式向Infobright中导入,最高280GB/小时。 

        2.在线分析 

        无论您的公司是在线广告网络~零售商~手机广告服务提供商或是任何其他的制造业~分析的重要性都与与日俱增~了解您网站的性能、您的客户的访问行为、评估广告和营销活动的效果~并分析成功与失败之间的差异~这能够让您企业与竞争对手拉开差距~取得最终的胜利。而这需要您对来自网页和离线方式的大量数据进行有效的利用~Infobright让您能够用低成本的方式轻松获得这种能力~相比与其他类似的方案~Infobright的成本低廉~管理简便~降低了您获得竞争优势的门槛。 

        3.数据集市,DataMart, 

        数据集市通常定义为包含特定应用分析的数据仓库,其分析应用与用户的业务紧耦合~具有较强的专业特性~因此通常针对集团内部某个特定的部门建设。在过去几年里~数据集市系统的实施数量快速增长~这种增长是由商业用户快速查询的需求驱动的。 

        过去数据集市项目由集团的IT部门统一实施~而现在~越来越多的集团内部用户部门自行实施数据集市项目~并由内部IT经理担任实施负责人~以确保数据集市的功能与需求吻合。 

        四、Infobright几大优点: 

        1.高压缩比率~平均压缩比可达10:1~甚至可以达到40:1~我用infobright把3.1G的数据存成不足300M。 

        2.列存储~即使数据量十分巨大~查询速度也很快。用于数据仓库~处理海量数据没一套可不行。 

        3.不需要建索引~就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放~每块有知识网格节点记录块内的统计信息~代替索引~加速搜索。 

        4.单一台服务器可以高效地读写30T数据。具有可扩展性~这里是指对于同样的查询~当数据量是10T时~它耗费的时间不应该比1T数据量时慢太多~基本是一个数量级内。 

        与MySQL对比: 

        1.infobright适用于数据仓库场合~即非事务、非实时、非多并发,分析为主,存放既定的事实,基本不会再变,~例如日志~或汇总的大量的数据。所以它并不适合于应对来自网站用户的请求。实际上它取一条记录比MySQL要慢很多~但它取100W条记录会比MySQL快。 

        2.MySQL的总数据文件占用空间通常会比实际数据多~因为它还有索引。infobright的压缩能力很强大~按列按不同类型的数据来压缩。 

        3.服务形式与接口跟MySQL一致~可以用类似MySQL的方式启用infobright服务~然后原来连接MySQL的应用程序都可以以类似的方式连接与查询infobright。这对熟练MySQL者来说是个福音~学习成本基本为0。 

        infobright有两个发布版:开源的ICE及闭源商用的IEE。ICE提供了足够用的功能~但不能INSERT~DELETE~UPDATE~只能LOADDATAINFILE。IEE除提供更充分的功能外~据说查询速度也要更快。 

        五、不足之处 

        不支持数据更新:社区版Infobright只能使用‚LOADDATAINFILE?的方式导入数据~不支持INSERT、UPDATE、DELETE 不支持高并发:只能支持10多个并发查询 

        


基于MySQL数据库结构设计查看MySQL连接数状态
PHP操作MySQL类无法远程连接MySQL服务器的几种情况及解决方法
CentOS系统MySQL优化详解通过数据库引擎来加速MySQL数据库
提高MySQL性能的方法 优化MySQL数据库性能的八大妙手
MySQL动态参数MySQL分区介绍
MySQL分区表测试MySQL数据库迁移常用方法
MySQL集群方案MySQL配置优化
MySQL的计划任务MySQL优化策略
信息发布:广州名易软件有限公司 http://www.myidp.net
  • 名易软件销售服务
  • 名易软件销售服务
  • 名易软件技术服务

  • Infobright基于MySQL的数据仓库