享诠咨询

前沿译文|世界银行:过度监管或有损东亚数字经济创新

作者:
2020-02-14 10:02:57

  编译

  对外经济贸易大学金融科技实验室

  译者按

  国家法律与数字经济发展的复杂关系一直是我们研究的中心议题。正如诺斯悖论所洞见的:国家既是经济发展的推动者,也是经济发展的破坏者,对于数字经济而言亦是如此。世界银行东亚与太平洋(601099,股吧)地区首席经济学家办公室于2020年1月发布的《东亚数字经济创新:限制性数字政策重要吗?》(Digital Innovation in East Asia:Restrictive Data Policies Matter?)报告梳理了东亚15国的数字经济法律政策,并使用定量研究的方法得出“数字限制指数”,直观展现出国家监管法律与企业创新之间的负相关关系。在这一研究中,中国的数字限制指数居于高位,这值得我们深思和警惕。毋庸讳言,当前中国经济发展正面临严峻挑战,数字经济已成为中国最有力的引擎,只有尽快采取更开放的数字经济政策,才能使中国经济行稳致远,此即“改革是最大红利”的真义。

  ――对外经济贸易大学数字经济与法律创新研究中心

  执行主任许可

  摘要

  数字技术鼓励公司通过新工艺、新产品和新服务进行创新,从而最终增强其在本地和全球市场上的竞争力。本文分析了各种各样的数据限制是否与公司的数字创新负相关。本文提出了数据限制指数,该指数衡量了东亚15个国家随时间推移,其数据政策的限制程度。通过使用不同企业层面的数据集,分析表明,数据限制限制了企业的创新能力。分析考虑到数据限制可能会对那些更依赖软件的企业产生更大的影响。

  回归分析表明,在数据政策更加严格的国家,企业不太可能通过许可证使用外国技术作为其创新过程的一部分。可获得数据的特定国家的案例还表明,限制性数据政策与公司使用专利和商誉等无形资产进行创新(在马来西亚和中国)和开发市场上新的研究开发创新(在越南)的可能性呈负相关。本文的结论是,开放数据政策可能会促进数字创新。

  1、介绍

  许多经济体的数字化转型为企业带来了广泛的创新机会。数字技术鼓励公司采用新工艺、新产品和新服务进行创新,从而最终提高其在当地和全球市场的竞争力。数字创新通常通过互联网和新的在线平台进行,企业越来越多地跨越国境访问这些平台。但是,如今许多公司在这些新的数字技术应用、互联网访问、在线平台的使用以及数据的跨境流动方面都面临着严峻的限制-其中大多数限制是政府最近才实施的。

  本文分析了在数据、互联网和在线平台的支持下,预计会影响数字创新的数据限制。我们将其统称为数据限制。数据限制阻碍了企业使用先进的软件和更广泛的跨境数据来进行的创新,而这些如今已成为许多企业创新过程的重要组成部分(Guellec和Paunov,2018年)。例如,大数据、人工智能(AI)和区块链是数字技术的新发展,它们产生并提供大量数据,来供企业用于开发新产品、新服务以及新工艺--所有这些都是都借助软件实现的。这些新技术有助于为企业创造竞争优势。因此,对数据的限制可能会减缓这种竞争过程。

  我们研究了东亚地区15个国家的数据限制政策,并调查这些限制是否确实影响了企业创新的可能性。我们以东亚国家为例的原因有两个。其一,数字创新在该地区盛行。经合组织最近的一份报告显示,东亚对数字技术的运用日益增加,正在引发经济和社会的转型(经合组织,2019年)。其次,该地区随着时间的推移,数据政策方面产生了有趣的变化。一方面,印度尼西亚、中国和越南等国家的数据政策非常严格,或者说随着时间的推移对数据的限制日益严格。另一方面,韩国、马来西亚和菲律宾等国家则已取消了数据限制。

  针对本次研究的目的,我们创造了一个指数来衡量15个东亚国家在数据政策方面受到限制的程度。该限制性指数建立在Ferracane等人先前的工作基础上(2018a; 2018b)。但随着新政策的出台,例如与知识产权(IPR)相关的政策,预计将在更大范围内影响数字创新。本文的第一步是描述和分析我们已经收集了政策发展情况的该地区15个国家的数据限制发展情况。然后,利用该政策指数来分析它与10个东亚国家企业创新活动绩效之间的关系。同时,我们考虑到数据限制可能会对数据密集型行业中的数字创新产生更大的影响,可以通过软件使用来衡量它们。最后,我们选择了三个具有特定企业层面数据的国家(马来西亚,越南和中国),并使用不同的变量进一步分析我们的限制性指数是否对企业的创新活动有影响。

  跨国研究和三个国家的相关性研究得出的结论表明,数据政策限制性更强的政策框架与企业进行数字创新的程度负相关。例如,在限制性数据政策水平较高的国家,企业不太可能通过许可使用外国技术。此外,国家案例研究表明,面临较高数据限制级别的马来西亚企业购买外国无形资产的可能性较小,而受到更高级别限制的越南公司则不太可能开发国际市场上的新商品和服务。结果表明,数据政策限制是东亚企业发展数字创新的重大障碍。

  本文的结构如下:第二部分阐述了进行这项研究的动机,并总结了有关数据、数字贸易和数字贸易政策限制的最新文献。第三部分介绍了估算策略,并讨论了两个层次的实证分析,即横向回归检验以及特定国家的回归案例。第四部分讨论了这两项分析的结果。第五部分通过将结果置于更广泛的政策环境中进行了总结。

  2、动机与最新文献

  尽管全球范围内数据流动呈上升趋势,但对这一主题的研究却出乎意料地有限。Manyika等人(2016年)声称,作为全球化的一部分,数据流的跨境和使用对GDP的贡献已经超过了商品流的贡献。该研究指出,经过近十年的发展,数据流目前占全球GDP增长总额的2.8万亿美元,对增长的贡献要大于传统商品贸易。

  最近的文献研究了数据的限制性政策。Stone等人进行了首次尝试(2015),其中仅包括数据本地化需求的度量。他们的研究指出,数据流提高了国内外专业服务公司的贸易效率。此外,Ferracane(2017)的工作进一步对影响数据跨界流动的现有数据政策的不同形式进行了分类。该研究调查了64个主要经济体的数据政策,以表明许多国家以不同形对不同类型的数据实施了数据限制。最后,Ferracane等人(2018b)为64个国家/地区制定了一个复杂的指数,其中评估了数据限制程度,涵盖了与跨境流动和数据国内使用相关的许多政策限制。本文使用该指数的更新和延展版本。

  分析数据限制对经济成果影响的研究很少。Van der Marel等人(2016)和Ferracane等人(2018b)的成果是仅有的两项研究,探讨与数据相关的监管政策如何影响生产力。作者从经济学的角度分析了这种联系,为 Ferracane 等人(2018a)的数据的跨境和国内使用建立了一个监管限制指数,并随着时间的推移扩展了该指数。作者通过在综合指标上回归企业层面的生产率来计算与限制性数据政策相关的成本,该指标评价限制性数据法规对使用软件作为衡量数据需要依赖行业的影响程度。他们发现,严格的数据政策往往会对数据密集型行业的公司业绩产生负面影响。本文采用了类似的识别方法,并分析了限制性数据政策对企业创新的影响。

  之前的其他研究专门针对与数据有关的政策框架,即欧盟通用数据保护条例(GDPR),并估算了经济成本。Christensen等人(2013年)使用校准技术来评估欧盟通用数据保护条例提案对中小企业(SME)的影响,并得出结论,认为大量使用数据的中小企业遵守这些新规则可能会产生大量费用。作者使用模拟动态随机一般均衡模型计算,结果显示多达100,000个工作岗位可能在短期内消失,长期可能超过300,000个。鲍尔等人的另一项研究(2013年)使用可计算的一般均衡GTAP模型估算欧盟通用数据保护条例的经济影响。研究发现,由于欧盟与世界其他地区之间的贸易减少,该项法律可能导致欧盟GDP损失高达1.3%。

  Goldfarb和Tucker(2012)用实证研究证明了限制性数据政策与创新之间的不利联系,并指出,之前针对卫生服务和在线广告领域的研究结果显示,更严格的隐私规定可能会损害创新活动。两项研究均表明,有效数据的获取和使用与基于开放市场的创新之间存在密切的联系。Goldfarb和Trefler(2018)的最新研究讨论了限制性数据政策的潜在理论含义,例如数据本地化和严格的隐私法规对创新和贸易的影响,尽管这是从人工智能的角度来看。作者明确指出,对于数据流是重要因素的扩展型创新人工智能产业,将被诸如数据本地化等限制性数据政策所遏制。

  本文基于Ferracane等人(2018a)的研究开发的特定并已扩展的数据政策限制指数,将文献的两个部分结合起来。然后将其与我们专门制定的一系列数据政策指数的东亚国家的企业数字创新活动相关联。该指数涵盖了与数据活动相关的各种指标,其范围比上文所述文件中使用的同类指数广泛得多。例如,除了对跨境流动和数据国内使用的限制外,我们现在还扩展了与数字部门知识产权、在线平台的中间责任和内容访问有关的限制,以及有关电信市场的监管政策。我们预计,这些数据限制将与企业创新的程度负相关,特别是在那些更依赖数据的行业中。在评估这一假设时,我们使用了Ferracane等人(2018b)开发的识别方法。

  3、实验策略

  本部分阐述了实证策略。我们根据Ferracane等人(2018a)的工作成果和Ferracane和van der Marel(2018)制定了一项综合指标。在这两项工作成果中,开发了一个数据关联变量,该变量将其数据政策指数与行业级别的数据强度度量进行交互。在我们的案例中,综合指标由包含数据限制的指数组成,包括与知识产权和电信相关的指数,该指数与衡量行业使用软件的密集程度的变量交互作用。我们认为,后一个变量粗略地指定了每个部门使用数据的数量。某些行业比其他行业更依赖数据,我们预计数据密集型行业受限制性数据政策变化的影响更大。为了证实这一看法,我们将数据政策指数与表示行业级别数据强度的软件使用程度进行加权。

  在第二小节中,我们介绍了回归的基线规范,在该规范中,我们使用了不同的企业层面的变量来衡量创新,并在数据限制的综合指标上对变量进行回归。并使用两种类型的企业层面的数据进行回归,第一种使用世界银行企业调查数据库在跨国和行业层面的总体数据,此外还针对少数东亚地区使用了三个特定国家的企业级数据集,即马来西亚、越南和中国。由这两个数据集得出的结果是互补的,因为它们为我们提供了不同的视角。世界银行的数据代表了跨国公司间跨时间的数据集合,这将使我们对该地区国家所做出的政策选择有一个整体的认识。第二种数据集专门针对马来西亚、越南和中国,并分析那些对跨国公司业绩起重要推动作用的政策是否也在这三个国家的企业中得到了证实。

  3.1数据链接

  数据链接指数的取值方式基于Arnold等人开创的计算方法。(2011年;2015年)。他们开创的测算“服务链接指数”的方法已在实践领域得到广泛使用。在我们的研究案例中,我们为数字创新设置了一个数据链接指数的变量,并在回归分析中使用了此综合指标。在对每个国家进行分析时,我们将各个国家的专属数据政策指数与(作为数据使用值的替代值的)软件使用量进行交互,以衡量某个部门在其生产过程中使用数据的程度。该识别策略基于这样的假设:在生产过程中更依赖软件的行业受数据限制的影响更大。这种加权算法是衡量限制性数据政策影响的一种更完善的方法,优于简单地采用无加权算法而将我们的数据政策指数回归到某一创新成果变量上。

  在此计算过程中,我们将国家的专属数据限制政策指数乘以代表每个下游产业的特定软件使用程度的数据强度。这就是设置数据链接(DL)变量的方式。在此变量中,数据强度表示为(D / L),它由该部门的软件使用量与劳动力数量的关系来衡量(见下文)。因此,在公式(1)中,术语?d表示每个部门的软件使用程度,此数据来自美国人口普查ICT调查。数据强度表示为每个下游部门中使用劳动的比率,称为LABj。此劳工数据可从美国劳工统计局(BLS)检索。由此,我们得出以下公式:

  请注意,与先前有关因子强度的文献相一致,我们也将强度指数记录在日志中。强度的表达方式近似于那些论述比较优势的文献,例如Chor(2011),Nunn(2007)和Romalis(2004)。最后,在公式(1)中,数据政策指数指的是衡量限制性数据政策的国家特定变量(请参见第3.3节),而软件数据则指美国特定行业一年期间的软件使用情况(请参阅第3.2节),以避免内生性问题。如果数据密集型部门随着时间的推移不断开展更多的数据创新活动,对任何国家而言,都将会导致数据监管限制的降低。因此,对一个国家使用其特定行业的通用数据强度会使变量更加具有外源性。

  3.2数据强度

  为了衡量公式(1)中定义的数据强度,我们使用了2011年美国人口普查ICT调查中有关软件使用的信息。这些数据基于调查,并以4位算法详细记录在NAICS部门中,其统计了每个行业和服务部门花费在ICT设备和计算机软件方面的投入,以百万美元为单位。

  我们将计算机软件支出纳入数据强度的考量。ICT调查记录了软件支出的两个独立变量,即资本化的软件支出和非资本化的软件支出。非资本化的计算机软件支出包括用于开发软件的购买和相关开发人员的薪资支出,以及软件许可和软件的服务协议支出。资本化的计算机软件支出包括设备和软件本身的资本支出。尽管将软件使用量作为替代值的统计不能完全洞察各行业使用电子数据的程度,但它仍然是我们可以公开找到的最接近真实状况的一种数据使用变量。但是请注意,在公司内部,由于数据的创新往往是基于软件的,因此为软件使用量作为替代因素提供了的充分理由。我们将2010年用于回归分析,并将此软件支出除以劳务量(同2010年数据),并将其用于我们的数据链接变量。

  诚然,这种数据强度的数据替换并不理想。但当前还没有有关各部门使用数据程度的数据。关于国家使用的数据量(例如由Cisco或Teleography记录的数据)只有一些猜测,但是即使这些来源也仅提供了少量的观察数据。即使如此,那些使用软件技术在互联网上和跨边界传输用于创新的数据是清晰可记的。数字创新的最简便程序需要借助软件来完成,并需借助软件来传输数据。另外,借助本身就是软件形式的云计算技术,可以使更多技术通过互联网进行高级数据传输。因此,尽管没有完全获取部门中实际使用的真实数据量,但在我们看来,利用每个行业对软件的使用强度的确是首选的最佳替代。

  figure1展示了根据非资本化软件支出计算出的每个部门的数据强度。3假设美国人口普查以2位制和4位制之间的混合级别记录此信息,则可以在NAICS中以不同的数字级别下载构建这些强度的数据。所有数据都符合ISIC Rev 3.1 2位数字级别。就业数据来自美国劳工统计局,以6位制给出,也与ISIC Rev 3.1 2位数字一致。我们在两个数据源之间以最细分的级别开发了自己的一致性矩阵,然后通过采用简单的平均值算法将其汇总到2位制。重新分类这些数据的原因是我们的创新变量在2位的ISIC版本3.1中提供。由于数据是在软件和人工上以两种不同的统计方式给出的,因此我们首先将所有数据汇总到ISIC中,然后统一计算强度。

  根据我们对软件支出的替代计算,figure1依照数据强度从高到低显示了15个行业的数据使用程度排名。毫无意外,电信业是最高数据强度级别的行业,与劳动力强度相比,它具有很高的软件强度。在剩余行业中,数据强度高的行业还有计算机、保险和金融,这也不足为奇。与劳工相比,他们使用大量软件来运行。广泛认为后两个部门是技术密集型行业,并且互联网技术的使用在金融服务业中也正显著增加。

  在统计图的另一端(图中未显示),家具、建筑、汽车销售和服装等行业的数据密集度最低。使用软件强度居中的行业是现代和传统行业的结合行业,例如运输服务和基本金属等各种制造行业。

  3.3数字创新数据政策指数

  数据链接变量的第二项是数据政策指数,该指数基于一组可量化的特定国家监管政策,这些监管政策预计会对数字创新产生限制性影响。这些限制性政策涉及数据的使用和传输、知识产权、中间责任、内容访问以及有关电信市场的监管制度。我们借鉴了Ferracane(2018a)和ECIPE的数字贸易估算(DTE)数据库来确立和构建此指数。指数的分析对象是那些被认为会对依靠数据进行创新活动的公司造成监管成本负担的政策。将某种政策措施列为对数据库产生限制性影响的策略的标准如下:(i)它是否为在线和离线数据用户创建了更加严格的制度;(ii)是否对国内外数据用户之间区别对待;(iii)是否以不经济不恰当的繁冗手段来实现某个政策目标。

  数据政策指数由6个不同种类因素组成,每个种类都包含与特定数字政策领域相关的一组政策限制,这些政策限制包括:知识产权(IPR),跨境数据流(CBDF),国内数据使用和处理(DP),中间责任(IL),内容访问(CA)以及基础架构和连接(INF)。我们认为,这些与数据相关的政策种类对东亚地区的数字创新形成了最大的政策限制。如上所述,每个类别都有各种特定的限制,可以在table1中进一步找到。Ferracane等人曾在2018年对上述限制做出具体解释,其文献还提供了有关形成限制动机的进一步信息,并讨论了评估其限制水平的方式。该指数涵盖2009-2019年的政策状况。此外,指数所代表的政策现均已更新,每个国家都推出了新监管措施。

  为了建立这个指数,每个具体的政策措施都将根据其限制范围的广度在0(完全开放)到1(实质为封闭)之间评分。分数越高,表示数据政策的限制程度越高。尽管某些数据政策对于保护非经济目标(例如个人隐私)或确保国家安全可能是合法且必要的,但这些政策仍然给开展数据相关创新活动的企业带来了巨额成本,因此也反映在我们的指数中。以DTE数据库为起点,我们使用从Ferracane等人2018版详细加权方案,将特定政策汇总到指数中。可在table1的最后一栏中找到相应论述。

  更具体地说,每种数据政策限制均按加权计算在完整的指数中。另外,在每个类别中,每个特定的政策限制也相互权衡。但是,在大多数情况下,政策限制在各自类别内的权重相等,如table1所示。对于每个类别而言,IPR和CBDF的权重一般相等,为0.25,因此两者合计占总指数的一半。另一半覆盖其余四个类别,其中DP和CA类别的权重均为0.15。IL和INF类别的权重为0.1。请注意,在某些情况下会包含新的特定政策限制,例如某个国家是否已制定了数据保护法,而Ferracane等人并未采用该法律(2018)。Ferracane(2018b)提供了有关权重、评分和政策措施说明的更多详细信息。

  应用我们的加权方案后,数据政策指数在0(完全打开)和1(实质性封闭)之间变化。指数越高,各国实施的数据政策越严格。table2概述了每个东亚国家/地区的最终指数,并显示了每种限制条件对最终指数得分的影响。显而易见,中国的得分最高,为0.91。在很大程度上,这是由IPR和CBDF类别中较高的政策限制导致的。在中国之后,越南得分为0.82,其次是泰国和印度尼西亚,两者的限制性水平均为0.64。限制最少的国家是中国香港特别行政区,得分为0.09,基本上是开放的。这仅显示了一些与知识产权和中间责任有关的较小限制。日本是第二受限制最少的国家,得分为0.20。如figure2和figure4所示,东亚地区组使我们的数据政策指数形成实质上的多样性。

  figure3显示了数据政策限制的完整指数在2009年至2019年之间如何随着时间而变化。该线性函数的指数涵盖的15个东亚国家的加权平均值,以其各自的GDP作为权重。这样做的原因是为了使整个地区得出无偏见的限制趋势,应根据各国的自身发展情况纠正国家的限制。越南这样的小国可能受到严格限制,但与中国或印度尼西亚相比,该限制对该地区的经济影响要小得多。

  因此,对所有国家一视同仁,将使整个地区的总体限制水平失真。我们可以看到,随着时间的流逝,指数有明显的上升趋势,反映出东亚地区的数据政策正在变得日益严格。

  3.4描述性分析

  在使用公司层面的创新数据进行计量经济学评估之前,我们首先对数据政策指标进行描述性分析,并说明其与在国家和行业层面上计算的现有创新变量之间的关系。

  首先,我们从世界银行企业调查中获取公司层面的创新变量之一,然后按国家和部门对该二进制信息进行平均。诚然,这样做存在问题,因为变量最初是二分的,并且在很大程度上取决于样本中包含的公司数量。但是,进行此分析以获得对计量经济学相关性可能采取的潜在研究方向的第一印象是有价值的。我们对所有部门进行了分析,但由于本文的主要研究对象为数据密集型行业中公司的反应能力,因此目前主要关注计算机和相关服务领域的状况。figure 1反映了计算机行业以及相关服务行业是软件的主要用户。

  figure4呈现了一种负相关关系:一旦我们分别统计出每个东亚国家的限制性数据政策指数和我们在企业调查数据库中发现的计算机和相关服务行业的创新偏好变量,就能发现二者呈负相关。该图取h5变量的平均值,但是对于从同一数据库中选择的其他创新变量,也会出现同样明显的负相关性。显然,数据限制程度较高的国家似乎在计算机服务行业方面的创新活动较少。在figure4中,中国是一个有趣的异常值。根据我们的数据政策指数衡量,我国的数据受到极大限制,但却同时在计算机服务方面表现出很高的企业层面创新水平。考虑到中国在数字领域的快速发展,这一现象不足为奇,但该数字也表明,中国显然仅是该地区一个少见的例外。

  figure 5展示了另一种有趣的相关性。我们引入了针对各国家根据我们的数据政策指数得出的特定变量,同时引用一个衡量东亚国家进口数字服务的数量占其商业服务总进口的份额的标准变量。同样在这种情况下,我们看到两个变量之间存在紧密的负相关性。这表明,在数据政策方面受到更多限制的国家数字服务进口份额更低。尽管我们的计量经济学分析没有考虑服务贸易的这种变量,但它指出了封闭数字创新与开放市场之间的紧密联系。服务贸易变量主要衡量通过软件等互联网执行的数字服务进口量,而数据政策指数则反映针对数字技术(例如互联网、数据和在线平台)的限制性贸易政策。

  但是,为了规范评估在每个东亚国家的整个经济中,数据密集型行业的公司是否由于较高的数据限制而在创新活动中受到了真正的影响,评估策略通过将各部门的软件使用情况作为替代量,来考察每个行业的数据密集程度。

  3.5基线回归

  如前所述,为衡量数据政策指数与东亚企业层面的创新活动是否有任何有意义的关系,我们采用了两种回归方法。

  第一种方法采用的是跨国维度,其中我们对拥有数据的10个东亚国家进行了回归分析。然后,我们进一步选取了一些国家,从国家来源专门记录了企业层面的数据,并评估了我们的跨国分析成果是否与这些国家的回归结论相一致。我们之所以采用这种分两步走的方法,主要有两个原因。首先是,跨国活动告诉我们一些国家随着时间的推移而产生的差异,而针对具体国家的活动则更加强调政策限制本身的发展,从而为更具体的政策建议提供指导。此外,这两个数据源记录了不同的创新变量,这些变量使我们可以进一步了解公司数据限制政策会对哪一部分创新产生影响。

  我们从跨国方法开始。在我们的基线回归中使用公式(1),这在下面的公式(2)中有详细说明。公式(2)测量了上述的数据链接指数与企业层面测得的若干创新变量(见下文)之间的时间相关性。因此,我们将在t年的第j行业中的c国的每个公司f?记录的企业层面的创新变量回归,而数据链接(DL)指标则是在国别-部门年度层面规定的。因此,作为相关性的回归基线规则采用以下形式:

  在公式(2)中,向量INNO由我们选择的东亚国家组中的四个企业层面创新变量组成。这些变量是:(1)公司在过去三年中是否引进了新产品/服务;(2)该公司在过去三年中是否引进了新工艺;(3)公司是否使用外国公司许可的技术;最后(4)该公司在过去三年中是否花费了新的研发费用(不包括市场研究)。四个变量分别由h1,h5,e6和h8表示,这与世界银行企业调查数据库的数据来源标识一致。需要注意这些公司层面的数据是2009年至2018年之间的各个年份的截面数据,因此不记录同一公司每年的数据。附件A中的tableA1、A2和A3以及figureA1提供了四个创新变量的累计企业分布概况,并按国家和行业分类提供了汇总统计数据。

  还要注意的是我们的因变量仅能以二进制方式允许响应的形式。企业调查数据库以简单的“是”或“否”报告这些答案。我们将变量转换为虚拟变量,以使其有效地成为INNOfcjt∈{0,1}的非线性估计。因此,我们被迫执行Probit模型。但是,在进入Probit回归之前,我们首先执行具有固定效果的LPM模型,因为前者为我们提供了有关Probit回归时最有可能走向的方向的其他信息。此外,对于我们的三个国家情况,只能进行LPM回归,因此出于一致性的原因,我们报告两种类型的结果。由于包括固定效应的各个方面,因此我们使用条件(固定效应)逻辑回归来估计Probit模型。

  如上所述,我们的DL变量是根据公式(1)在国家/地区/年份级别定义的,因此在所有三个维度上都存在变化。虽然我们拥有截至2019年的数据政策指数数据,但由于企业调查数据没有进一步发展,因此我们只能包含截至2018年的数据。

  公式(2)还分别包括来自按国家(c)、行业(j)和时间(t)的固定影响。不仅如此,尽管事实是我们的因变量是在公司层面给出的,但我们不能包括企业层面的固定效应,因为企业调查数据集具有相互重叠的跨行业性质,因此,随着时间的推移,跟踪同一公司的发展是不可能的。最后, fcjt是误差项,对于LPM回归,其是按照行业国家进行聚类。对于我们的Probit回归,我们无法聚类,但是数据是按照行业分组的。

  我们的第二种方法是使用特定国家的企业层面的数据。我们拥有来自马来西亚、越南和中国的企业层面的数据集。显然,这三个数据集的可变覆盖范围不同,这意味着尽管所有三个数据集都报告了公司的资产负债表信息,但创新指标在彼此之间并不一致。该数据仅适用于制造业。

  在下面的公式(3)中给出的回归规范中,创新变量再次汇总在一个称为INNO的向量中,其中从属的创新变量也为虚拟变量。因此,公式(3)中的INNOfcjt∈{0,1}。与公式(2)相比,经验设置在很大程度上相似,只是有一些细微的差异。其一是由于我们未观察到任何国家的软件使用和劳动情况,因此需要对公式(1)中定义的数据使用指标进行调整。对于任何东亚国家,都很难找到有关这两个变量的数据。其次,回归方程只针对一个国家,以便关注政策随时间的变化(与横向分析中国家之间的政策差异相反)。为了更详细地分析后一个方面,我们的DL度量现在将尽可滞后2年,或至少滞后1年。

  总体而言,这三个国家的基准回归方程如下:

  其中,INNO由记录在马来西亚、越南和中国每个国家特定的数据集的创新变量组成。DL术语与公式(2)中数据策略指标与数据/软件强度相互作用的项完全相似。但是,在我们的三个国家中,由于该地区缺少有关该变量的数据,因此我们只能测量数据使用的绝对比例作为总投入使用的一部分。我们使用国家投入产出(IO)矩阵来计算这三个国家每个行业的ICT服务在总投入使用中的比例。国家IO表取自世界银行,并按2进制数字ISIC Rev.4进行报告。IO表可用于每个国家,因此代表了一致的来源。我们采用国内水平(即不包括进口)以及在分析时间段开始或中间的一年中的输入系数。

  此外,术语f,j和t分别是公司、行业和年度的固定影响。当然,由于存在三个特定于国家的回归,因此我们自然不能得出任何国家固定影响。最后,j是误差项,对于LPM回归,现在将其按行业进行聚类。总而言之,由于技术限制,我们无法运行Probit模型,因此无法在所有三个国家执行LPM。此外,对于中国,我们也在数次研究中执行OLS,因为数据类型为我们提供了支持。

  4、结论

  本节以类似的后续方式分别阐述两种分析方法得出的结论。跨国回归分析的结论在table3和table4中给出,其中分别报告了LPM和Probit结论。特定国家的分析结论在后续图表中呈现。

  4.1跨国回归分析结论

  基于table3中对LPM回归分析,结果证明其几乎是无关紧要的,这意味着在大多数情况下,数据链接变量与企业的创新活动之间没有发现统计学上的显着相关性。也就是说,数据的限制性政策与公司选择引入新产品或服务(如第1列中所示),引入新的组织程序(如第2列中所述)或在研发上花费更多的费用之间没有任何实质性的关联(如第4列所示)。但是,第3列反映的结论确实体现出一些差异,这表明限制性数据政策与公司是否采用外国公司许可的技术有显著的负相关性。

  由于第3列中的系数现在已得到精确估算,table4中关于Probit的回归分析也得出了相符的结论:限制性更强的数据政策与公司从外国公司获得许可技术的可能性较低密切相关。考虑到更改数据政策指数的边际影响不是恒定的,因此,作为数据链接指数变量的限制政策系数每增加一单位,企业使用外国许可技术的可能性就会降低一些。即使第1列和第4列中的符号给出了负方向,其他三个正方向的创新变量仍然保持着影响甚微的状态(在LPM回归中并非如此)。还要注意,与LPM结果相比,Probit系数值显着增加。

  外国许可技术变量影响较大这一事实可能会引起人们的怀疑。事实上,也许会存在被许可的外国技术中可能包括软件技术的情况,因此可能与我们的数据政策指数相关联。这是因为公式(2)中数据链接变量的乘法项还包含每个行业使用软件的程度。但是,仔细研究“企业调查”变量说明就会得出如下调查问题:“除了办公软件外,该机构目前是否使用了外国公司许可的技术?”因此,我们确信在回归分析中不存在任何人为或虚假的相关性。相反,由系数分析结论得,作为公司创新活动一部分的外国许可技术似乎与一个国家的数据监管政策框架息息相关。此外,更严格的数据限制似乎阻碍了一国使用软件的行业进行企业级创新。

  4.2 特定国家的结果

  本节介绍了针对马来西亚、越南和中国这些特定国家的回归结果。附件B、C和D分别提供了有关回归问题所涵盖的调查问题和变量的详细信息,以及有关马来西亚、越南和中国这些特定国家的每个数据集的一些摘要统计数据。

  4.2.1马来西亚

  对于马来西亚,我们拥有有关每个公司购买、使用和生产无形资本(例如专利、商誉、在建工程(包括新的和二手无形资产的进口))的程度以及每家公司的研发支出数额的数据。二手资产是指购买以前在马来西亚使用的资产,包括在该国被收购之前经过翻新或修改的资产。购买资产是指新购买的资产,最后,生产资产是指企业在马来西亚生产供自己使用的资产。

  由于使用了与ISIC Rev.4完全对应的MSIC 2008分类,因此数据只涵盖到2008年以后的年份。然而,如果我们应用年固定效应,我们将只有两年的时间作为对象来进行分析,即2010年和2015年。所有变量都以二进制模式进行转换,因此大于0的正值将被赋值为1,否则赋值为0。

  在转向回归结果之前,figure7提供了用于实证规范的主要变量的描述性检查。该图在横轴上绘制了马来西亚ICT服务投入的IO系数,并与来自马来西亚数据集的所有四个企业层面的创新变量的综合指标(我们称之为创新得分)相对应。我们称之为创新得分,并将其总结为INNO项。这个创新得分计算为,其中 N 是问题的总数。创新得分按行业和年份进行平均。如图所示,拟合值线是在不包括可口可乐和石油以及其他制造和再生产部门的基础上绘制的,因为他们似乎是极端的异常值(请注意,这两个部门也从未排除在回归之外)从较高的ICT服务密集型部门对我们的创新评分更高的意义上看,向上倾斜的相关性是显而易见的。回归将显示如figure8所示,马来西亚数据政策限制性指数是否有任何作用。

  调查结果记录在table5中。其中,第1列中R&D支出的回归系数给出了显着的结果,这在某种程度上是违反直觉的。由于企业创新活动进入国外市场受到限制,因此企业要对更多的研发活动做出反应,这对于数字创新必不可少。在第3列中,系数结果给出负且显着的结果。它表明,数据密集型行业的公司(以其ICT服务投入的份额作为代理)面临更高水平的数据政策限制,这与企业无形资产作为其生产的一部分使用率降低有关。第2列和第3列中的购买和生产的无形资产变量均提供负系数符号,但在统计上并不重要。

  4.2.2越南

  以越南为例,尽管第一个使用的变量与马来西亚数据重叠,但我们有一组不同的变量:两者都报告了公司执行了研发活动的规模。第二个创新变量可以更精确地衡量公司的研发活动是否有针对性,在针对市场或世界的新创新中,是否针对市场上新出现的创新,在这种情况下,这个变量的值取1。如果这种创新对公司来说只是新的,那么这种观察得分为0。接下来的两个变量用于衡量公司是否拥有任何国家或国际专利,越南数据集中也提供了这些专利。最后,最后一个变量是衡量公司是否进行任何形式的研究合作。所有变量均涵盖2010-2013年,但由于我们的结构滞后,因此只能包含三年。

  figure9首先概述了五个企业层面的变量的IO系数和创新得分之间的相关程度。越南的创新得分的计算方法与马来西亚相似,并且IO系数来自越南IO表。一条向上倾斜的拟合值曲线被绘制出来,表明这两个变量之间总体上存在正相关关系。(但是请注意,出于上述类似原因,在绘制拟合值时,焦炭和石油行业以及造纸和印刷行业都将被排除在外。我们的回归分析也排除了这两个行业。)化学和制药部门的创新得分要高得多,并且作为其国内总投入用途的一部分,其ICT服务投入也很高。另一方面,食品和饮料等行业的两个指标水平都要低得多。figure10概述了越南数据政策指数的发展。

  回归结果的相关性见table6。在几乎所有列中,结果与正系数结果在统计上是没有意义的。在5%的水平上,唯一负的且显着的变量是在第2列中,是否是公司针对市场或世界的新创新。但是,有趣的是,在这种情况下,第1列中的R&D变量也像马来西亚一样为正。当应用1年的滞后时间时,此结果将在10%的水平上变得显着,第5列中的研究合作变量也是如此。

  4.2.3中国

  对于中国,我们获取了不同的数据,这些数据不是基于调查产生的。中国创新的数据通常很难获得。因此,我们不得不使用来自汤森路透(Thomson Reuters)数据库的数据,这些数据记录了总部位于中国的私营和上市公司的信息。我们只记录了与我们的研究目的相关的两个变量,即无形资产净值和R&D支出(均为美元)。数据年份跨度较长,涵盖了我们整个数据政策指数的持续时间,即从2009-2019年。figure11概述了我们在中国的限制性指数的发展。如人们所见,鉴于整个时期的限制程度都很高,该国的限制性指数几乎没有变化。

  figure10显示了将研发支出的变量除以每家公司的雇员人数与ICT服务投入系数之间的关系。(再次注意,可口可乐和石油行业被排除在外。)相关性是成正比的、紧密的,这表明使用ICT服务作为其整体投入结构一部分的部门具有较高的人均企业支出在研发上。对于回归分析,因为我们执行LPM,所以我们将变量转换为0到1之间的二进制模式,当公司没有报告任何价值时为零,以防企业报告的研发支出和无形资产为正值。然后,我们在回归分析中还使用了研发支出的大小以及人均支出,并进行OLS检验这些结果是否提供任何进一步的证据。

  结果报告在table7中。前两列分别显示了LPM回归的R&D支出和净无形资产的结果。结果表明,只有无形资产净值上的结果具有负相关迹象。因此,它表明,在面临更高水平的数据限制的情况下,活跃于ICT服务密集型行业的公司报告的无形资产水平较低。结果并不甚显著,甚至对研发支出的期望系数不是负数,而是正数,与马来西亚和越南的结果一致。但是,当使用类似的变量执行标准OLS回归时,第3列的结果表明,在这种情况下,R&D支出显著为负。然而,无形资产的变量仍然微不足道。第5列和第6列中的人均变量在执行OLS时都没有显示出显著的结果。

  5、结论

  开放市场对企业顺利进行数据创新存在深刻影响,数据、知识产权、平台和电信市场方面的政策限制都可能会对企业的数字创新产生连锁作用。的确,本文发现,就10个东亚国家的数据而言,在线平台和其他与数据相关领域的限制性政策与企业进行创新的可能性呈负相关,这种负相关在较多使用大量软件进行技术创新的行业尤其明显。因此,对数据、知识产权、平台和电信的限制性较小的政策对企业顺利实现数字经济创新至关重要。

  对于数据政策较为严格的国家而言,公司通过许可使用外国技术作为其创新活动的一部分的可能性较小。此外,这三个针对特定国家的研究案例表明,限制性数据政策与公司使用专利和商誉等无形资产进行创新(以马来西亚和中国为例),以及通过市场新研发进行创新的可能性之间存在负相关关系(以越南为例)。因此,综合所有因素,我们得出的结论是,不采取针对数据及相关领域的不必要和限制性政策的开放市场环境有益于企业进行创新。

  本文仅论述了相关性,但并没有迹象表明因果推断在该领域无存在可能,当然应该谨慎对待这一结论。若存在这样的因果推断,如本文所述,封闭数据和其他数据相关技术的市场亦不会在数字领域对数字创新存在益处。而且,我们确立的指数所反映的限制种类对于那些利用无形资产进行创新的公司同样具有重要意义。当前,包括东亚在内的世界上许多国家正在经历着从基于货物和商品的有形经济向日益以服务、数据和创意等无形资产为基础的无形经济的重大转变。因此,至关重要的是,各国应共同营造一个友好的政策环境,使各国公司可以借力于新经济发展成果来获取更多运营资本,同时,也应将各国合法的非经济目标纳入国际政策环境构建的考量之中。

本文首发于微信公众号:数字经济与社会。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:张洋 HN080)
阅读0
0评论 | 投诉
转发
收藏

精彩评论