
1.1 Excel处理数据的缺点
对于大多数人来说,使用Excel已经能够处理工作中95%以上的问题,那么有什么问题是Excel处理不了的呢? Excel能够实现数据存储和编辑、函数应用和图表展现,这些都是Excel作为桌面数据处理软件最为强大的证明,但Excel在处理数据时也有缺点。
Excel在Office家族中是功能强大的产品,在桌面数据处理和分析与展现工具中,市场占有率很高,评价也非常好。但是随着数据量的增加,Excel在处理大量数据的时候也会存在一些瓶颈。Excel初级入门用户可能不会碰到这些问题,但是一旦上升到中级或高级应用,涉及函数和复杂计算的条件,Excel的处理效率明显会降低很多。都存在一些什么样的效率问题呢?下面我们来看一看。
1. 基于当前工作表的大表模式处理
Excel在多个工作簿和工作表中进行数据处理的时候,存在一定的缺陷,如果数据来源是多个表,并且希望基于多个表进行数据的整合和处理,必须将所有的表数据全部整合之后,才能进行数据的计算和处理。如果数据量比较大,则会存在严重的性能方面的问题。
2. 数据保存和处理限制
Excel支持的最大行和最大列都是有限制的,无法突破1048576行,同时也无法突破65536列。这也意味着使用Excel处理是有数据存储方面的限制,如果超出了这个限制,将无法使用Excel进行数据存储和处理。而在实际的业务处理过程中,如果面对的数据是几百万条甚至是几千万条,使用Excel 会存在一定的局限性,当数据的行列上限突破Excel支持的行列上限,则无法进行数据存储和处理。
3. 数据的交互特性限制
在Excel进行数据交互的过程中,存在比较大的局限性。用户只能通过编写VBA脚本的方式进行数据的交互和处理,而脚本编写进行数据处理存在一定的门槛,这个门槛就会让大部分人放弃使用Excel进行数据分析和处理,转而使用SQL管理工具进行数据结果的处理,再将结果导入Excel中。
4. 缺乏多类型数据源支持
在默认情况下,Excel进行数据导入是非常有限的,除了支持标准的文件和数据库外,其他类型的数据基本不支持。如果数据源是MySQL或Oracle这样的数据库,通过Excel 是无法进行连接的,怎么办呢?如果我们需要获取一个文件夹中的相应的数据,除了编写VBA脚本之外,似乎也没有太好的办法。
5. 数据处理的性能问题
在Excel中如果存在公式,处理数据的效率将会降低。公式越多,Excel处理的效率将会越低。当数据量大于10万行后,整个Excel 进行数据处理的效率将会非常低。
这些是中级和高级数据分析人员在使用Excel处理数据的过程中碰到的比较多的问题。如果我们的数据来源于不同的数据源,例如,处理的数据来源于网站、表格、Oracle,这时候使用Excel进行数据的保存和处理就存在瓶颈了。