ADO 读取Excel文件数据, 丢失数据或数据错误问题。

whalechen 2021-12-22 原文


ADO 读取Excel文件数据, 丢失数据或数据错误问题。


在用ADO读取Excel文件数据,常容易发生丢失数据的现象。

例如,用ADO打开一个Excel文件的代码如下:
 Dim objConn As ADODB.Connection
    Dim objRS As ADODB.Recordset
    Dim objRSTable As ADODB.Recordset
   
    Set objConn = New ADODB.Connection
    Set objRS = New ADODB.Recordset
    objRS.CursorLocation = adUseClient
   
    With objConn
        .Provider = “Microsoft.Jet.OLEDB.4.0”
        .ConnectionString = “Data Source=” & Me.ExcelPath & “;Extended Properties=””Excel 8.0;HDR=NO;”””
        .CursorLocation = adUseClient
        .Open
    End With
   
    \’ Check whether there is a sheet named “master” in the excel file
    Set objRSTable = objConn.OpenSchema(adSchemaTables)
blnMasterSheet = False
    For i = 1 To objRSTable.RecordCount
        If UCase(CStr(objRSTable.Fields(“TABLE_NAME”).Value)) = “MASTER$” Then
            blnMasterSheet = True
            Exit For
        End If
        objRSTable.MoveNext
    Next i
       
    Set objRSTable = Nothing
    If Not blnMasterSheet Then
        MsgBox (“Master Worksheet Is Not Found”)
        Set objConn = Nothing
        Set objRS = Nothing
        GetExcelData = False
        Exit Function
    End If
   
    strExcuteScript = “select * from [Master$A1:F]”
    objRS.Open strExcuteScript, objConn, adOpenStatic, adLockOptimistic
运行后发现第一列的某些行数据丢失了。这发生在第一行是数字,第二行是文字的情况。
因为在读取excel的时候,ODBC会根据第一行的文字来设定返回的recordset的字段类型,当第一行是数字时,就会认为整列都是数字的。结果后面的字符无法读出。

这时,需要把连接字符串改为.ConnectionString = “Data Source=” & Me.ExcelPath & “;Extended Properties=””Excel 8.0;HDR=NO;IMEX=1;”””

其中,IMEX=1;这个属性的意思是,以文本方式读取excel表。 那么就算第一行是数字,后面的字符串也可以正常读出了。

问题好像是解决了。但过一段时间后,又出现了问题,读取某个列的某个行时,会出现错误。错误现象为

我们读取Excel表格后,会把数据传到另一个recordset (假定为R2)再进行处理的。在给另一个recordset付值时出错。根据错误信息,得知如果把一个超长的或者错误的数据付给一个字段时会出现这样的错误。但在R2中,我们设定了对于的字段的长度是1000的,而要付值的数据长度是628,为什么还会出错呢。这个R1的字段出来的值后面也带有很多的乱码。就是说,本来从Excel中读出来的数据已经是乱码了。

      我们把怀疑产生乱码的所有空格去掉,结果错误到了下一行。再把正常的数据复制变成很长,结果也会产生错误。再尝试把前面的正常行去掉,居然错误就不见了。
        把断点设在错误的那行,查数据的长度,是628, 再看rs.fileds(11).defineSize, 发现只有255. 那就说明,它实际字段是认为长255的,但把数据都读出来了,结果是乱码,再把这些乱码付值给另一个recordset时才报错。
        把产生错误的数据放在第一行时,是不会有这个错误的,查看它的defineSize, 发现不再是255了,而是很大的数字。
        再尝试把错误的数据放在1-8行,都不会产生问题,在9行以上就会产生。

        原来,ODBC在读取Excel时,会有个值设置TypeGuessRows=8, 意思是ODBC会先在前8行的数据中去比较,如果所有的数据都在255或以下,那这个字段长度就是varchar(255),否则,这个字段将是text类型。

      于是,我们加上TypeGuessRow=100,再试,结果错误依然存在。

      原来,虽然可以设置这个属性,但ODBC是不会去用它的,要使这个属性有效,必须修改注册表。对于注册表键是

Excel 97

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\3.5\Engines\Excel
Excel 2000 and later versions

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel

修改了里面的TypeGuessRow后,这个问题暂时解决了。

但是,如果大的数据在表的后面位置的话,这个问题还是有可能发生的。所以要彻底的解决的话,在打开一个recordset前,就要先定义好它的字段长度了。
     

发表于
2006-04-26 20:18 
whale 
阅读(4439
评论(1
编辑 
收藏 
举报

 

版权声明:本文为whalechen原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/whalechen/archive/2006/04/26/385930.html

ADO 读取Excel文件数据, 丢失数据或数据错误问题。的更多相关文章

  1. ADO 读取Excel文件数据, 丢失数据或数据错误问题。

    在用ADO读取Excel文件数据,常容易发生丢失数据的现象。 例如,用ADO打开一个Excel文件的代码如下: […]...

  2. ADO 中的并发编码(MSDN)

    ADO 中的并发编码 发布日期: 12/23/2004 | 更新日期: 12/23/2004 Rick Dob […]...

随机推荐

  1. 单片机基础知识

    单片机概述 什么是单片机? 单片机:在一块硅片上集成了微处理器、存储器及各种输入/输出接口的芯片,这样一块芯片 […]...

  2. 编程语言排行分析

    目录 一、世界编程语言排行榜 二、历年排名情况 1、2009年 2、2010年 3、2011年 4、2012年 […]...

  3. Python爬虫之小试牛刀——使用Python抓取百度街景图像

    之前用.Net做过一些自动化爬虫程序,听大牛们说使用python来写爬虫更便捷,按捺不住抽空试了一把,使用Py […]...

  4. 模块三:文字处理软件Word 2010 的使用

      项目一: 文本的编辑与修饰 ( 新建、保存、编辑、文字的选择、 移动、复制、查找和替换、 字体格式、边框和 […]...

  5. SURF特征点检测原理

            SURF算法原理: 1、SURF特征检测的步骤                1.尺度空间的极 […]...

  6. JAVA基础之序列化与反序列化

    序列化和反序列化:   把对象转化为字节序列的过程称为序列化;   把字节序列恢复为对象的过程称为对象的反序列 […]...

  7. JAVA HTML 以压缩包下载多文件

    Html:  利用form表单来发送下载请求 <form id ="submitForm" method […]...

  8. 返回一个二维数整数组中最大子数组的和

    题目:返回一个二维整数数组中最大子数组的和  要求: n输入一个二维整形数组,数组里有正数也有负数。 n二维数 […]...

展开目录

目录导航