新技术算法
Ⅰ 最懂你的“算法”,如何不沦为“算计”
来源 摘编自《平台治理2.0:共同富裕时代数字经济治理转型》,电子工业出版社,2022年4月出版。
文 于凤霞 国家信息中心信息化和产业发展部处长
随着互联网、大数据、算法与人工智能等的发展日新月异,平台经济的崛起使得追求物美价廉、方便快捷的消费者与世界各地的商品和服务之间的距离只是点击几下鼠标而已。网络世界、新兴技术正在使我们更加便利、舒适,我们每天都在享受平台经济繁荣发展带来的福利。大数据和算法等技术功不可没。
克里斯托弗·斯坦纳在其着作《算法帝国》里对算法推崇备至,认为构建算法模仿、超越并最终取代人类,是21世纪最重要的能力,未来属于算法及其创造者。 科技 哲学家凯文·凯利在其着作《失控》中提到:“人们在将自然逻辑输入机器的同时,也把技术逻辑带到了生命之中……机器人、经济体、计算机程序等人造物也越来越具有生命属性。”
随着平台经济在人类经济 社会 各领域的快速渗透,我们的生活已经悄悄地被算法和数据控制,算法与数据接管了整个 社会 。算法为人类行为赋能,但受所输入数据的质量及算法模型本身的限制,内在地嵌入了人类正面或负面的价值观,并能动地制造着各种风险。
阿里尔·扎拉奇在其《算法的陷阱:超级平台、算法垄断与场景欺骗》一书中写道,精妙的算法与数据运算改变了市场竞争的本质,复杂多变的市场现实已在悄无声息中将权力移交到少数人的手中,因此,必须由监管机构及时采取可行的方法和政策,有效化解算法带来的各种风险,促使创新能够真正为 社会 带来正面意义。
经过长期的数据沉淀和算法优化,你的手机、你的常用App在某些方面确实会比你的家人、好友甚至你本人更了解你。这就意味着,当我们在利用算法的时候,也不自觉地成了被算法计算的对象。
“大数据杀熟”意指同样的产品或者服务,老客户看到的价格反倒比新客户所看到的更高。而且还存在同一用户信息在不同网络平台之间被共享的问题,许多用户都遇到过这样的情形:在一个网站浏览或搜索的内容很快会被另一个网站进行推荐或成为其广告客户。
在传统销售模式下,通常是老客户能够享受到更多的优惠,这些优惠往往通过会员卡、积分制等不同形式来实现,也广为大众所接受。
然而,通过网络平台开展的许多销售活动,却出现了相反的情况:随着用户在某个平台上消费次数的增加、消费金额的不断提高,其最开始能够享受到的各种优惠却会逐渐消失,甚至变成老用户可能要付出更高的价钱获得服务,而新用户则能够享受到各类优惠。
这种问题在美国早就引起过热议,2000年亚马逊曾对68款盘片进行类似的定价机制。新顾客购买价格为22.74美元,老顾客却需要26.24美元。在引起消费者广泛质疑后,亚马逊CEO贝佐斯回应这只是随机价格的一种测试,并向高价客户退还差价,这次风波才得以平息。2012年《华尔街日报》又爆料一家名为Staples的文具店的“差别定价”事件。
从某种意义上说,“大数据杀熟”属于大数据营销,部分平台在有了大数据这个强大的用户画像工具后,实现了千人千面的定价机制。利用大数据技术对用户资料进行细分,根据用户习惯建立用户画像,然后通过画像给用户推荐相应的产品与服务,并且进行差异化定价。
根据《中华人民共和国价格法》第十四条规定,经营者提供相同商品或者服务,不得对具有同等交易条件的其他经营者实行价格歧视。由于该法未针对“同等交易条件”进行详细解释,严格说来,网络平台依据大数据分析所做的“差别定价”并不能完全和“价格歧视”画等号。
人们之所以会对“大数据杀熟”产生怀疑甚至愤怒,根本上是因为平台定价机制和供需匹配规则不透明。
基于用户注册及个人信息、地理位置、消费记录、搜索习惯等行为数据,平台能够针对不同的用户形成独特的用户画像。这一画像有助于平台为用户提供精准的个性化服务,但也埋下了“大数据杀熟”的潜在风险。
针对新老用户或不同消费习惯的用户,一些平台提供的同一产品或服务,存在较为严重的价格歧视现象,引发广泛争议。平台定价机制和供需匹配规则的不透明,还使得消费者在权益遭到损害时陷入举证难、维权难的境地。
算法引发的第二个问题可以被称为“信息茧房”和“回声室效应”。
“信息茧房”可能带来的后果是,长期被禁锢在其中的个人,其思维甚至是生活可能呈现出一种定式化、程序化的状态,失去了解不同事物的能力和接触机会;另外,还可能加剧人与人的差异性、分化,甚至很有可能带来一大批 社会 极端分子,从而带来安全威胁,影响 社会 的稳定。
经济学家安东尼·唐恩斯认为,人们容易从观点相似的人那里获取信息,从而减少信息成本。网络虚拟社群一方面使爱好相似的人们聚集到一起,但高度同质化的聚集也减少了他们接受多元化声音的可能,从而形成封闭的“回声室”。
算法给用户推荐的信息内容,如新闻标题、内容、图片、评论等,都会影响用户的情绪,甚至改变用户的思想和观点。在这些场景中,算法本身只是从优化业务的角度出发进行推荐和内容分发,这些算法的长期高频率使用,在客观上深刻地影响着用户的思想和行为,甚至影响整个 社会 的价值传播。
因此,算法作为一种技术工具,或许是中立的无所谓正向或负向价值观,但如果算法技术与商业利益密切联系,或者被应用于与人和 社会 相关的场景时,必然会引发一系列 社会 问题,不容回避。
算法引发的第三个主要问题是流量造假和流量劫持。
一些平台或商家通过人为或机器操作手段提高关键词搜索量、平台用户数、广告点击量、视频播放量、产品购买量、服务评论数等,还有部分平台通过强制跳转、妨碍破坏等技术手段,或者使用定向引流、广告混淆等非技术手段劫持本应属于竞争对手的流量,诱导用户使用己方的产品或服务。
在直播电商领域中,2020年新华社曾报道,山东临沂电商从业者孙玲玲,在某电商平台经营一家销售糖果类产品的店铺,一个月内,孙玲玲找了多位带货主播,这些主播粉丝数量都超过百万,但几乎每场带货都以赔钱收场,流量造假问题也相当突出。
当前关于规范恶意流量竞争的制度尚不健全。一是法律规定较为模糊,尤其是对于流量不正当竞争行为的构成要件与法律责任缺乏明确界定;二是平台企业流量竞争手段越来越隐蔽和复杂,导致不正当竞争行为的举证、认定及对损害和赔偿额度的确定都存在较大难度。
随着网络技术的进步与平台经济的发展,如何规制流量恶意竞争等新型不正当竞争行为、营造公平竞争的市场环境,成为亟须深入研究的重要课题。
此外,还有操纵榜单和控制热搜等问题。“热搜”原本反映的是当前舆论最关切的热点问题,但在实践中我们发现,其后台算法有可能被滥用,出现操纵榜单、控制热搜、人为制造舆论热点等问题,严重影响着民众对热搜的信任。
卓别林的电影《摩登时代》对机器操控产业工人的讽刺,以及马克思着作《1844年经济学哲学手稿》对机器工业化时代人类“异化”的警示,无不提醒我们,就像机器流水线有可能凌驾于劳动工人之上一样,当今无处不在的算法若应用不当,也有可能成为一种凌驾于人之上的力量,为人和 社会 的发展带来新的风险。
为此,有效加强算法监管,积极应对新技术发展带来的挑战,让人类更好地享受新技术发展的福利,是顺应平台经济发展趋势的必然要求。
针对算法应用这一全新的治理课题,我国正在不断加强相关领域的制度建设和规范。如早在2018年,我国资管新规《关于规范金融机构资产管理业务的指导意见》就提出要避免智能算法的顺周期性风险,要求金融机构,应当根据不同产品投资策略,研发对应的人工智能算法或者程序化交易,避免算法同质化加剧投资行为的顺周期性,并针对由此可能引发的市场波动风险制订应对预案。
此外,新规提出,因算法同质化、编程设计错误、对数据利用深度不够等人工智能算法模型缺陷或者系统异常,导致“羊群效应”、影响金融市场稳定运行的,金融机构应当及时采取人工干预措施,强制调整或者终止人工智能业务。
2020年12月中共中央印发的《法治 社会 建设实施纲要(2020-2025年)》提出,制定完善对网络直播、自媒体、知识社区问答等新媒体业态和算法推荐、深度伪造等新技术应用的规范管理办法;加强对大数据、云计算和人工智能等新技术研发应用的规范引导。
尤其是2021年出台的系列制度,从反垄断等不正当竞争、保护消费者权益、保护个人信息安全等不同角度和侧重点,对算法应用引发的“大数据杀熟”行为提出了规范要求。
2021年2月,《关于平台经济领域的反垄断指南》规定,基于大数据和算法,根据交易相对人的支付能力、消费偏好、使用习惯等,实行差异性交易价格或者其他交易条件;对新老交易相对人实行差异性交易价格或者其他交易条件;实行差异性标准、规则、算法;实行差异性付款条件和交易方式等,都可能被认定为“大数据杀熟”等不正当竞争行为而面临更严格的监管。
2021年8月,国家市场监督管理总局公布的《禁止网络不正当竞争行为规定(公开征求意见稿)》第二十一条指出,经营者不得利用数据、算法等技术手段,通过收集、分析交易相对方的交易信息、浏览内容及次数、交易时使用的终端设备的品牌及价值等方式,对交易条件相同的交易相对方不合理地提供不同的交易信息,侵害交易相对方的知情权、选择权、公平交易权等,扰乱市场公平交易秩序。
从监管的角度来看,反不正当竞争法对“大数据杀熟”行为的规制的最大特点在于,企业并不需要具备市场支配地位,无论平台企业的市场地位如何,经营者利用技术手段,实施“二选一”行为,或者利用数据、算法等技术手段,侵害交易相对方的知情权、选择权、公平交易权等,扰乱市场公平交易秩序,实施“大数据杀熟”的行为,均会受到反不正当竞争法的限制。
2021年11月1日开始正式实施的个人信息保护法,第一次在法律文本中定义了“自动化决策”一词的含义,即“通过计算机程序自动分析、评估个人的行为习惯、兴趣爱好或者经济、 健康 、信用状况等,并进行决策的活动”。对利用个人信息进行自动化决策做了针对性的规范,要求个人信息处理者保证自动化决策的透明度和结果的公平、公正,不得通过自动化决策对个人在交易价格等交易条件上实行不合理的差别待遇,并在事前进行个人信息保护影响评估。个人认为自动化决策对其权益造成重大影响的,有权拒绝个人信息处理者仅通过自动化决策的方式做出决定。
可以说,这里的规定,更加强调对用户人格权益的保护,旨在保护个人信息安全。
算法规制的第二个重点是,算法在互联网信息服务领域的应用。
2021年8月,国家互联网信息办公室就《互联网信息服务算法推荐管理规定(征求意见稿)》向 社会 公开征求意见。征求意见稿中明确,所谓的算法推荐技术,是指应用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息内容。
这意味着,各类信息流平台、用户生成内容(UGC)平台都在被监管范围内。甚至在朋友圈内常见的信息流广告,亦是推荐算法的结果,也应该遵守相关规定。
征求意见稿第一次区分了生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类五类向用户提供信息内容的算法技术,并就算法推荐服务提供者的责任和义务、算法推荐服务公告和算法备案等制度、算法推荐未成年人模式做出了详细规定。
在网络信息内容生态方面,征求意见稿提出,算法推荐服务提供者应当坚持主流价值导向,优化算法推荐服务机制,积极传播正能量,促进算法应用向上向善。
强调要“建立完善人工干预和用户自主选择机制”,也就是说,不能依赖算法进行内容推荐,要增加人工识别及筛选的过程,在首页首屏、热搜、精选、榜单类、弹窗等重点环节积极呈现符合主流价值导向的信息内容。
这意味着,在压实互联网信息服务平台主体责任方面,除了要求对谣言及其他不法信息进行治理,算法决策的合规化也是一个重要抓手。
在平台算法推荐服务过程中,依据何种算法和逻辑使用数据,将成为平台算法规制的重要内容。征求意见稿对算法推荐服务提供者在算法规则及公示方面都提出了要求。
2021年9月,国家互联网信息办公室印发《关于加强互联网信息服务算法综合治理的指导意见》,提出要用三年左右时间,逐步建立治理机制健全、监管体系完善、算法生态规范的算法安全综合治理格局。
在健全算法安全治理机制方面,《意见》提出要致力于打造形成政府监管、企业履责、行业自律、 社会 监督的算法安全多元共治局面。尤其是要强化平台企业主体责任,明确提出,企业应强化责任意识,对算法应用产生的结果负主体责任,并建立算法安全责任制度和 科技 伦理审查制度。
在促进算法生态规范发展方面,《意见》则提出要推动算法公开透明,督促企业及时、合理、有效地公开算法基本原理、优化目标、决策标准等信息,做好算法结果解释,畅通投诉通道。
《平台治理2.0》,于凤霞 着
电子工业出版社,2022年4月出版
近年来数字经济增加值在我国GDP中的占比不断提升,但相对经济总量而言还是偏低;新业态新模式发展过程中也出现了新的问题和挑战。因此,在推动和规范数字经济发展的同时,需要重构治理体系,进一步突出竞争政策基础地位,并构建起全方位、多层次、立体化的治理体系。本书围绕平台治理,分析我国在数字治理、反垄断等方面的 探索 ,平台经济在发展过程中的挑战和可能的应对之策。
Ⅱ 区块链技术的六大核心算法
区块链技术的六大核心算法
区块链核心算法一:拜占庭协定
拜占庭的故事大概是这么说的:拜占庭帝国拥有巨大的财富,周围10个邻邦垂诞已久,但拜占庭高墙耸立,固若金汤,没有一个单独的邻邦能够成功入侵。任何单个邻邦入侵的都会失败,同时也有可能自身被其他9个邻邦入侵。拜占庭帝国防御能力如此之强,至少要有十个邻邦中的一半以上同时进攻,才有可能攻破。然而,如果其中的一个或者几个邻邦本身答应好一起进攻,但实际过程出现背叛,那么入侵者可能都会被歼灭。于是每一方都小心行事,不敢轻易相信邻国。这就是拜占庭将军问题。
在这个分布式网络里:每个将军都有一份实时与其他将军同步的消息账本。账本里有每个将军的签名都是可以验证身份的。如果有哪些消息不一致,可以知道消息不一致的是哪些将军。尽管有消息不一致的,只要超过半数同意进攻,少数服从多数,共识达成。
由此,在一个分布式的系统中,尽管有坏人,坏人可以做任意事情(不受protocol限制),比如不响应、发送错误信息、对不同节点发送不同决定、不同错误节点联合起来干坏事等等。但是,只要大多数人是好人,就完全有可能去中心化地实现共识
区块链核心算法二:非对称加密技术
在上述拜占庭协定中,如果10个将军中的几个同时发起消息,势必会造成系统的混乱,造成各说各的攻击时间方案,行动难以一致。谁都可以发起进攻的信息,但由谁来发出呢?其实这只要加入一个成本就可以了,即:一段时间内只有一个节点可以传播信息。当某个节点发出统一进攻的消息后,各个节点收到发起者的消息必须签名盖章,确认各自的身份。
在如今看来,非对称加密技术完全可以解决这个签名问题。非对称加密算法的加密和解密使用不同的两个密钥.这两个密钥就是我们经常听到的”公钥”和”私钥”。公钥和私钥一般成对出现, 如果消息使用公钥加密,那么需要该公钥对应的私钥才能解密; 同样,如果消息使用私钥加密,那么需要该私钥对应的公钥才能解密。
区块链核心算法三:容错问题
我们假设在此网络中,消息可能会丢失、损坏、延迟、重复发送,并且接受的顺序与发送的顺序不一致。此外,节点的行为可以是任意的:可以随时加入、退出网络,可以丢弃消息、伪造消息、停止工作等,还可能发生各种人为或非人为的故障。我们的算法对由共识节点组成的共识系统,提供的容错能力,这种容错能力同时包含安全性和可用性,并适用于任何网络环境。
区块链核心算法四:Paxos 算法(一致性算法)
Paxos算法解决的问题是一个分布式系统如何就某个值(决议)达成一致。一个典型的场景是,在一个分布式数据库系统中,如果各节点的初始状态一致,每个节点都执行相同的操作序列,那么他们最后能得到一个一致的状态。为保证每个节点执行相同的命令序列,需要在每一条指令上执行一个“一致性算法”以保证每个节点看到的指令一致。一个通用的一致性算法可以应用在许多场景中,是分布式计算中的重要问题。节点通信存在两种模型:共享内存和消息传递。Paxos算法就是一种基于消息传递模型的一致性算法。
区块链核心算法五:共识机制
区块链共识算法主要是工作量证明和权益证明。拿比特币来说,其实从技术角度来看可以把PoW看做重复使用的Hashcash,生成工作量证明在概率上来说是一个随机的过程。开采新的机密货币,生成区块时,必须得到所有参与者的同意,那矿工必须得到区块中所有数据的PoW工作证明。与此同时矿工还要时时观察调整这项工作的难度,因为对网络要求是平均每10分钟生成一个区块。
区块链核心算法六:分布式存储
分布式存储是一种数据存储技术,通过网络使用每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在网络中的各个角落。所以,分布式存储技术并不是每台电脑都存放完整的数据,而是把数据切割后存放在不同的电脑里。就像存放100个鸡蛋,不是放在同一个篮子里,而是分开放在不同的地方,加起来的总和是100个。
Ⅲ 大数据常用的各种算法
我们经常谈到的所谓的 数据挖掘 是通过大量的数据集进行排序,自动化识别趋势和模式并且建立相关性的过程。那现在市面的数据公司都是通过各种各样的途径来收集海量的信息,这些信息来自于网站、公司应用、社交媒体、移动设备和不断增长的物联网。
比如我们现在每天都在使用的搜索引擎。在自然语言处理领域,有一种非常流行的算法模型,叫做词袋模型,即把一段文字看成一袋水果,这个模型就是要算出这袋水果里,有几个苹果、几个香蕉和几个梨。搜索引擎会把这些数字记下来,如果你想要苹果,它就会把有苹果的这些袋子给你。
当我们在网上买东西或是看电影时,网站会推荐一些可能符合我们偏好的商品或是电影,这个推荐有时候还挺准。事实上,这背后的算法,是在数你喜欢的电影和其他人喜欢的电影有多少个是一样的,如果你们同时喜欢的电影超过一定个数,就把其他人喜欢、但你还没看过的电影推荐给你。 搜索引擎和推荐系统 在实际生产环境中还要做很多额外的工作,但是从本质上来说,它们都是在数数。
当数据量比较小的时候,可以通过人工查阅数据。而到了大数据时代,几百TB甚至上PB的数据在分析师或者老板的报告中,就只是几个数字结论而已。 在数数的过程中,数据中存在的信息也随之被丢弃,留下的那几个数字所能代表的信息价值,不抵其真实价值之万一。 过去十年,许多公司花了大价钱,用上了物联网和云计算,收集了大量的数据,但是到头来却发现得到的收益并没有想象中那么多。
所以说我们现在正处于“ 数字化一切 ”的时代。人们的所有行为,都将以某种数字化手段转换成数据并保存下来。每到新年,各大网站、App就会给用户推送上一年的回顾报告,比如支付宝会告诉用户在过去一年里花了多少钱、在淘宝上买了多少东西、去什么地方吃过饭、花费金额超过了百分之多少的小伙伴;航旅纵横会告诉用户去年做了多少次飞机、总飞行里程是多少、去的最多的城市是哪里;同样的,最后让用户知道他的行程超过了多少小伙伴。 这些报告看起来非常酷炫,又冠以“大数据”之名,让用户以为是多么了不起的技术。
实际上,企业对于数据的使用和分析,并不比我们每年收到的年度报告更复杂。已经有30多年历史的商业智能,看起来非常酷炫,其本质依然是数数,并把数出来的结果画成图给管理者看。只是在不同的行业、场景下,同样的数字和图表会有不同的名字。即使是最近几年炙手可热的大数据处理技术,也不过是可以数更多的数,并且数的更快一些而已。
在大数据处理过程中会用到那些算法呢?
1、A* 搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的较佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是较佳优先搜索的范例。
2、集束搜索(又名定向搜索,Beam Search)——较佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过,集束搜索只能在每个深度中发现最前面的m个最符合条件的节点,m是固定数字——集束的宽度。
3、二分查找(Binary Search)——在线性数组中找特定值的算法,每个步骤去掉一半不符合要求的数据。
4、分支界定算法(Branch and Bound)——在多种最优化问题中寻找特定最优化解决方案的算法,特别是针对离散、组合的最优化。
5、Buchberger算法——一种数学算法,可将其视为针对单变量较大公约数求解的欧几里得算法和线性系统中高斯消元法的泛化。
6、数据压缩——采取特定编码方案,使用更少的字节数(或是其他信息承载单元)对信息编码的过程,又叫来源编码。
7、Diffie-Hellman密钥交换算法——一种加密协议,允许双方在事先不了解对方的情况下,在不安全的通信信道中,共同建立共享密钥。该密钥以后可与一个对称密码一起,加密后续通讯。
8、Dijkstra算法——针对没有负值权重边的有向图,计算其中的单一起点最短算法。
9、离散微分算法(Discrete differentiation)。
10、动态规划算法(Dynamic Programming)——展示互相覆盖的子问题和最优子架构算法
11、欧几里得算法(Euclidean algorithm)——计算两个整数的较大公约数。最古老的算法之一,出现在公元前300前欧几里得的《几何原本》。
12、期望-较大算法(Expectation-maximization algorithm,又名EM-Training)——在统计计算中,期望-较大算法在概率模型中寻找可能性较大的参数估算值,其中模型依赖于未发现的潜在变量。EM在两个步骤中交替计算,第一步是计算期望,利用对隐藏变量的现有估计值,计算其较大可能估计值;第二步是较大化,较大化在第一步上求得的较大可能值来计算参数的值。
13、快速傅里叶变换(Fast Fourier transform,FFT)——计算离散的傅里叶变换(DFT)及其反转。该算法应用范围很广,从数字信号处理到解决偏微分方程,到快速计算大整数乘积。
14、梯度下降(Gradient descent)——一种数学上的最优化算法。
15、哈希算法(Hashing)。
16、堆排序(Heaps)。
17、Karatsuba乘法——需要完成上千位整数的乘法的系统中使用,比如计算机代数系统和大数程序库,如果使用长乘法,速度太慢。该算法发现于1962年。
18、LLL算法(Lenstra-Lenstra-Lovasz lattice rection)——以格规约(lattice)基数为输入,输出短正交向量基数。LLL算法在以下公共密钥加密方法中有大量使用:背包加密系统(knapsack)、有特定设置的RSA加密等等。
19、较大流量算法(Maximum flow)——该算法试图从一个流量网络中找到较大的流。它优势被定义为找到这样一个流的值。较大流问题可以看作更复杂的网络流问题的特定情况。较大流与网络中的界面有关,这就是较大流-最小截定理(Max-flow min-cut theorem)。Ford-Fulkerson 能找到一个流网络中的较大流。
20、合并排序(Merge Sort)。
21、牛顿法(Newton's method)——求非线性方程(组)零点的一种重要的迭代法。
22、Q-learning学习算法——这是一种通过学习动作值函数(action-value function)完成的强化学习算法,函数采取在给定状态的给定动作,并计算出期望的效用价值,在此后遵循固定的策略。Q-leanring的优势是,在不需要环境模型的情况下,可以对比可采纳行动的期望效用。
23、两次筛法(Quadratic Sieve)——现代整数因子分解算法,在实践中,是目前已知第二快的此类算法(仅次于数域筛法Number Field Sieve)。对于110位以下的十位整数,它仍是最快的,而且都认为它比数域筛法更简单。
24、RANSAC——是“RANdom SAmple Consensus”的缩写。该算法根据一系列观察得到的数据,数据中包含异常值,估算一个数学模型的参数值。其基本假设是:数据包含非异化值,也就是能够通过某些模型参数解释的值,异化值就是那些不符合模型的数据点。
25、RSA——公钥加密算法。较早的适用于以签名作为加密的算法。RSA在电商行业中仍大规模使用,大家也相信它有足够安全长度的公钥。
26、Schönhage-Strassen算法——在数学中,Schönhage-Strassen算法是用来完成大整数的乘法的快速渐近算法。其算法复杂度为:O(N log(N) log(log(N))),该算法使用了傅里叶变换。
27、单纯型算法(Simplex Algorithm)——在数学的优化理论中,单纯型算法是常用的技术,用来找到线性规划问题的数值解。线性规划问题包括在一组实变量上的一系列线性不等式组,以及一个等待较大化(或最小化)的固定线性函数。
28、奇异值分解(Singular value decomposition,简称SVD)——在线性代数中,SVD是重要的实数或复数矩阵的分解方法,在信号处理和统计中有多种应用,比如计算矩阵的伪逆矩阵(以求解最小二乘法问题)、解决超定线性系统(overdetermined linear systems)、矩阵逼近、数值天气预报等等。
29、求解线性方程组(Solving a system of linear equations)——线性方程组是数学中最古老的问题,它们有很多应用,比如在数字信号处理、线性规划中的估算和预测、数值分析中的非线性问题逼近等等。求解线性方程组,可以使用高斯—约当消去法(Gauss-Jordan elimination),或是柯列斯基分解( Cholesky decomposition)。
30、Strukturtensor算法——应用于模式识别领域,为所有像素找出一种计算方法,看看该像素是否处于同质区域( homogenous region),看看它是否属于边缘,还是是一个顶点。
31、合并查找算法(Union-find)——给定一组元素,该算法常常用来把这些元素分为多个分离的、彼此不重合的组。不相交集(disjoint-set)的数据结构可以跟踪这样的切分方法。合并查找算法可以在此种数据结构上完成两个有用的操作:
查找:判断某特定元素属于哪个组。
合并:联合或合并两个组为一个组。
32、维特比算法(Viterbi algorithm)——寻找隐藏状态最有可能序列的动态规划算法,这种序列被称为维特比路径,其结果是一系列可以观察到的事件,特别是在隐藏的Markov模型中。
Ⅳ 变频调速SVPWM技术的原理、算法与应用的目录
电气自动化新技术丛书序言
5届电气自动化新技术丛书编辑委员会的话
前言
第1章 变频调速与SVPWM技术
1.1 变频调速概述
1.1.1 变频调速系统
1.1.2 变频器
1.1.3 电力电子电器件
1.2 变频器谐波的影响与对策
1.2.1 输入侧谐波的影响与对策
1.2.2 输出侧谐波的影响及对策
1.3 SPWM技术
1.3.1 调?的原理和分类
1.3.2 SPWM波形成的方法
1.3.3 SPWM的优点与缺点
1.3.4 SPWM的优化
1.4 变频调速系统的控制
1.4.1 开环控制
1.4.2 闭环控制
1.5 SVPWM技术
1.5.1概述
1.5.2 SVPWM技术的原理与分类
1.5.3 SVPWM技术的优点与展望
参考文献
第2章 两电子SVPWM?术
2.1 两电平逆变器
2.2 两电乎逆变器合成电压矢量与磁链的空间分布
2.2.1 逆变器输出电压空间矢量的空间分布
2.2.2 电压矢量与磁链矢量轨迹
2.3 SVPWM的调制模式和算法
2.3.1 多个电压矢量连续切换的SVPWM模式
2.3.2 矢量合成法的SVPWM模式
2.4 对称调制模式和算法
2.4.1 基本原理
2.4.2 实施算法
2.4.3 对称调制模式与SPWM的比较
2.4.4 对称调制模式的特点和优点
2.4.5 对称调制模式的推广
2.5 两电平SVPWM的新算法
2.5.1 随机控制算法
2.5.2 免疫算法
2.5.3 反向传播神经网络算法
2.6 两电平三维空间电压矢量SVPWM控制
2.6.1 三相四桥臂逆变器
2.6.2 三相四桥臂逆变器的电压空间矢量
2.6.3 三相四桥臂逆变器的电压空间矢量控制
参考文献
第3章 两电平SVPWM技术的应用
3.1 两电平SVPWM技术在矢量变换控制中的应用
3.1.1 矢量变换控制的基本原理
3.1.2 SVPWM矢量控制系统的构成与控制原理
3.1.3 矢量变换控制的特点
3.2 SVPWM在直接转矩控制系统中的应用
3.2.1 直接转矩控制的基本原理
3.2.2 直接转矩控制系统的构成与控制原理
3.2.3 电压矢量与少的关系
3.2.4 采用电压矢量选择表的直接转矩控制系统
3.2.5 直接转矩控制的数字化
3.2.6 直接转矩控制的特点与存在的问题
3.3 直接转矩控制的改进方案
3.3.1 模糊控制的直接转矩控制
3.3.2 预测转矩的直接转矩控制
3.4 采用谐振极软开关逆变器的直接转矩控制
3.4.1 RPZVT逆变器的构成及工作原理
3.4.2 控制系统的构成
3.4.3 控制原理
3.4.4仿真及实验结果
3.5 PWM整流器的控制
3.5.1 PWM整流器
第4章三电平SVPWM技术
第5章三电平SVPWM技术的应用
第6章多电平SVPWM技术及其应用
第7章SVPWM技术工程应用实例
Ⅳ 算法工程师的项目落地能力指什么
1、深刻理解业务,能根据业务需求调整实现方案的能力
就拿茶具的例子说,客户更关注不良品不能漏,宁可杀错,不可放过,所以这时候我们就得把业务朝着不良品检出率方向去优化;
2、结合业务需求的熟练工程实现能力
我们拿到一个项目需求以后,大脑中得立马有一个框架,这个项目输入输出是什么?得用到哪几个模型?适合什么样的业务框架?开发需要多久?调优需要多久?能达到什么样的指标?然后按照自己的规划进行开发调优。
3、对数据敏感,有较强的数据处理与数据维护管理能力
算法工程师一定要对数据敏感,看一眼数据就能知道这些数据能支持什么样的任务?有没有坑?数据该怎么标注与维护高效省成本?
4、对新技术的求知欲与探索学习能力
目前人工智能技术刚兴起,技术和算法迭代很快,所以对算法工程师追新技术,新解决方案的能力也有要求,不能落后太久。比如现在有个推理性能的瓶颈,攻关了很久没有突破,但是可能就已经有开源的方案了,而这就需要我们经常查资料,看论文了。
5、各部门的沟通合作能力
这是个通用能力,算法工程师当然也需要,就像这个茶具项目中的一样,算法工程师接到不合理的需求一定要及时沟通,并用自己的专业知识,给出更合理的解决方案,各部门一起为项目落地努力。
Ⅵ 采用的新技术和新方法
在本书的研究实例中采用一系列新方法,主要包括:①运用遗传算法和神经网络技术进行储层参数的横向预测;②运用分形几何学研究裂缝平面分布规律;③运用灰色系统理论进行未测试层段的聚类分析;④运用灰色模式识别技术进行多参数的储层横向预测;⑤尝试运用导电效率进行储层类型判别。
本书具有以下特色:
(1)地质与物探的紧密结合。地质资料、测井资料和地震资料在对油藏的表现能力方面存在着精度和覆盖能力上的差别,运用岩心资料与测井资料建立二者之间的数学关系,可以完成储层参数的测井评价,用测井来约束地震资料,可以将储层参数准确地扩展为三维场,达到井间预测的目的。
(2)多种数学方法的运用。储层研究的最终目的是达到对储层特征及其三维分布规律的认识,定量化描述过程中储层特征是以特征参数的形式来体现和进行信息传输的,各种参数之间的匹配也是基于数值运算来完成的,数学方法在这些过程中起着“桥梁”的重要作用。可以说,没有近代数学的发展,储层研究只能停留在对储层基本地质特征的“就事论事”式的文字性描述的水平,而不可能达到真正的预测。本书中充分体现现代储层研究的定量化、信息化特色,通过获取大量的储层参数,运用各种数学方法(包括数理统计学、地质统计学、非线性数学)对这些数字化信息进行处理,最终通过这些特征参数的空间分布规律来描述和预测储层,指导油气的勘探和开发。
(3)理论与生产实际相结合。研究实例中运用传统储层研究方法技术的同时,尽可能多的使用新方法、新技术、新理论,但并不以方法的先进与否来评价其相对优劣,而是同研究实例义和庄奥陶系油气藏实际相结合,每种方法的运算结果都要同油藏实际进行对比,进行误差分析,达到限定误差的方法或误差最小的方法所得的结果才被允许进入下一流程,以保证储层研究的最终精度。所以,研究中不仅仅是对多种储层研究方法技术的一次练兵,其结果也可以用来指导奥陶系油气藏的勘探开发。同时,研究中对多种新方法的运用,对具有相似地质特征的碳酸盐岩裂缝性储层的描述具有较大的借鉴意义。
(4)体现储层研究的层次性。储层研究的技术路线是有一定规则的。本书中研究的技术路线有一定的特色,在点—面—体的主路线指引下,穿插有多种次级技术路线,如地质模型—数学模型—预测模型的由定性到定量的技术路线,测井解释中的常规数学方法—非线性数学方法,地震参数横向预测中的常规单地震参数预测—反演单地震参数预测—多地震参数综合预测,以及支持主路线的岩心—测井—地震的研究顺序等。
Ⅶ H.264算法的简介
新型的H.264/ MPEG-4 AVC视频压缩标准获得ISO/IEC以及ITU-T认证(ISO/IEC 14496-10), 同以往许多视频标准相比,此标准又上一个台阶。新型的H.264/MPEG-4AVC标准产生更高质量的画面效果, 而且大大降低了比特率, , 比H.263, MPEG-2还要低50%以上,这样就降低了带宽或存储成本, 从而这种新型视频应用技术得到广泛应用。H.264/MPEG-4 AVC 被认为是过去10年视频压缩领域最杰出的成就, 它已经在高速发展的视频应用技术中找到了自己的方向。这种编解码产生了高质量的图像,比H.263+和MPEG-4 ASP更低的比特率, 是当前最有效的D1视频压缩解决方案。
H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。
H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准。通过该标准,在同等图象质量下的压缩效率比以前的H.263和Mpeg-2标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。
各个厂家都会针对自己的硬件和软件平台,对H.264算法进行研究,优化。本文介绍北京拓扑威视新技术有限公司在DM642平台上的H.264算法。
北京拓扑威视公司的TVI-264是高度优化的视频编解码器, 可运行于德州仪器TMS320DM64xTM。TVI-264的设计达到了视频效果高质量,节约成本的要求, 广泛应用于视频相关产品,如:IP 可视电话和视频监控照相机这些要求低延时的产品应用,视频会议, 远程教育系统以及其他视频应用产品最佳的选择。TVI-264编解码器可运行于德州仪器TMS320CM64xTM 和TMS320DM64XTM。另外, 也可应用于H.264码流主机为基础的回放, 并保存原始数据。
Ⅷ 量子遗传算法的国内外研究现状
当前科学技术正进入多学科互相交叉、互相渗透、互相影响的时代,生命科学与工程科学的交叉、渗透和相互促进是其中一个典型例子,也是近代科学技术发展的一个显着特点。遗传算法的蓬勃发展正体现了科学发展的这一特点和趋势。
制造机器智能一直是人类的梦想,人们为此付出了巨大的努力。人工智能技术的出现,就是人们得到的成果。但是,近年来,随着人工智能应用领域的不断拓广,传统的基于符号处理机制的人工智能方法在知识表示、处理模式信息及解决组合爆炸等方面所碰到的问题已变得越来越突出,这些困难甚至使某些学者对强人工智能提出了强烈批判,对人工智能的可能性提出了质疑。
众所周知,在人工智能领域中,有不少问题需要在复杂而庞大的搜索空间中寻找最优解或准优解。像货朗担问题和规划问题等组合优化问题就是典型的例子。在求解此类问题时,若不能利用问题的固有知识来缩小搜索空间则会产生搜索的组合爆炸。因此,研究能在搜索过程中自动获得和积累有关搜索空间的知识,并能自适应地控制搜索过程,从而得到最优解或准有解的通用搜索算法一直是令人瞩目的课题。遗传算法就是在这种背景下产生并经实践证明特别有效的算法。
遗传算法(Genetic Algorithm, GA)是近年来迅速发展起来的一种全新的随机搜索与优化算法,其基本思想是基于Darw in的进化论和Mendel的遗传学说。该算法由密执安大学教授Holland及其学生于1975年创建。此后,遗传算法的研究引起了国内外学者的关注。自1985年以来.国际上已召开了多次遗传算法的学术会议和研讨会.国际遗传算法学会组织召开的ICGA( International Conference on Genetic Algorithms)会议和FOGA( Workshop on Foundation of Genetic Algorithms)会议。为研究和应用遗传算法提供了国际交流的机会。
作为一种通用的问题求解方法,遗传算法采用简单的编码技术来表示各种复杂的结构并通过对一组编码表示进行简单的遗传操作和优胜劣汰的自然选择来指导学习和确定搜索的方向。
近年来,遗传算法已被成功地应用于下业、经济答理、交通运输、工业设计等不同领域.解决了许多问题。例如,可靠性优化、流水车间调度、作业车间调度、机器调度、设备布局设计、图像处理以及数据挖掘等。本文将从遗传算法的理论和技术两方而概述目前的研究现状。描述遗传算法的主要特点、基木原理以及各种改进算法,介绍遗传算法的程序设计。
遗传程序设计是借鉴生物界的自然选择和遗传机制,在遗传算法的基础上发展起来的搜索算法,它己成为进化计算的一个新分支。在标准的遗传算法中,由定长字符串(问题的可行解)组成的群体借助于复制、交叉、变异等遗传操作不断进化找到问题的最优解或次优解。遗传程序设计运用遗传算法的思想,常采用树的结构来表示计算机程序,从而解决问题。对于许多问题,包括人工智能和机器学习上的问题都可看作是需要发现一个计算机程序,即对特定输入产生特定输出的程序,形式化为程序归纳,那么遗传程序设计提供了实现程序归纳的方法。
把遗传算法和计算机程序结合起来的思想出现在遗传算法中,Holland把产生式语言和遗传算法结合起来实现分类系统,还有一些遗传算法应用领域的研究者将类似于遗传算法的遗传操作施加于树结构的程序上。
近年来,遗传程序设计运用遗传算法的思想自动生成计算机程序解决了许多问题,如预测、分类、符号回归和图像处理等,作为一种新技术它己经与遗传算法并驾齐驱。 1996年,举行了第1次遗传程序设计国际会议,该领域己引起越来越多的相关学者们的兴趣。
1967年,Holland的学生J.D.Bagley在博士论文中首次提出“遗传算法(Genetic Algorithms)”一词。此后,Holland指导学生完成了多篇有关遗传算法研究的论文。1971年,R.B.Hollstien在他的博士论文中首次把遗传算法用于函数优化。1975年是遗传算法研究历史上十分重要的一年。这一年Holland出版了他的着名专着《自然系统和人工系统的自适应》(Adaptation in Natural and Artificial Systems),这是第一本系统论述遗传算法的专着,因此有人把1975年作为遗传算法的诞生年。Holland在该书中系统地阐述了遗传算法的基本理论和方法,并提出了对遗传算法的理论研究和发展极其重要的模式理论(schema theory)。该理论首次确认了结构重组遗传操作对于获得隐并行性的重要性。同年,K.A.De Jong完成了他的博士论文《一类遗传自适应系统的行为分析》(An Analysis of the Behavior of a Class of Genetic Adaptive System)。该论文所做的研究工作,可看作是遗传算法发展进程中的一个里程碑,这是因为,他把Holland的模式理论与他的计算实验结合起来。尽管De Jong和Hollstien 一样主要侧重于函数优化的应用研究,但他将选择、交叉和变异操作进一步完善和系统化,同时又提出了诸如代沟(generation gap)等新的遗传操作技术。可以认为,De Jong的研究工作为遗传算法及其应用打下了坚实的基础,他所得出的许多结论,迄今仍具有普遍的指导意义。
进入八十年代,遗传算法迎来了兴盛发展时期,无论是理论研究还是应用研究都成了十分热门的课题。1985年,在美国召开了第一届遗传算法国际会议(International Conference on Genetic Algorithms ,ICGA),并且成立国际遗传算法学会(International Society of Genetic Algorithms ,ISGA),以后每两年举行一次。
1989年,Holland的学生D.E.Goldberg出版了专着《搜索、优化和机器学习中的遗传算法》(Genetic Algorithms in Search , Optimization, and Machine Learning)。该书总结了遗传算法研究的主要成果,对遗传算法及其应用作了全面而系统的论述。同年,美国斯坦福大学的Koza基于自然选择原则创造性地提出了用层次化的计算机程序来表达问题的遗传程序设计( genetic programming, GP)方法,成功地解决了许多问题。
在欧洲,从1990年开始每隔一年举办一次Parallel Problem Solving from Nature 学术会议,其中遗传算法是会议主要内容之一。此外,以遗传算法的理论基础为中心的学术会议还有Foundations of Genetic Algorithms,该会也是从1990年开始隔年召开一次。这些国际会议论文,集中反映了遗传算法近些年来的最新发展和动向。
1991年,L.Davis编辑出版了《遗传算法手册》(Handbook of Genetic Algorithms),其中包括了遗传算法在工程技术和社会生活中的大量应用实例。
1992年,Koza发表了他的专着《遗传程序设计:基于自然选择法则的计算机程序设计》”。1994年,他又出版了《遗传程序设计,第二册:可重用程序的自动发现》深化了遗传程序设计的研究,使程序设计自动化展现了新局面。有关遗传算法的学术论文也不断在《Artificial Intelligence》、《Machine Learning》、《Information science》、《Parallel Computing》、《Genetic Programming and Evoluable Machines》\《IEEE Transactions on Neural Networks》,《IEEE Transactions on Signal Processing》等杂志上发表。1993年,MIT出版社创刊了新杂志《Evolutionary Computation》。1997年,IEEE又创刊了《Transactions on Evolutionary Computation》。《Advanced Computational Intelligence》杂志即将发刊,由模糊集合创始人L.A.Zadeh教授为名誉主编。目前,关于遗传算法研究的热潮仍在持续,越来越多的从事不同领域的研究人员已经或正在置身于有关遗传算法的研究或应用之中。
Ⅸ 人工智能具有什么推动信息技术与传统产业深度融合
一是构建创新载体,组建智能传感器等,加强人工智能共性技术研发;二是推动改革创新,支持上海浦东新区、北京、成都等八个地方探索产业发展新路径、新举措;三是促进融合智能发展,在制造业、交通、医疗教育等行业,成功部署一批智能化解决方案,有效促进产业转型升级;四是培育领军企业,在全国率先探索新兴旗帜,围绕人工智能巩固提升产业创新能力,竞争产生出一批优秀的技术产品。
一是坚持创新驱动,加快突破创新核心技术,加强人工智能相关基础理论、关键技术研究,积极探索新领域、新技术、新算法,加强人工智能新技术的研究,打造共性技术平台,促进创新成果的产业化。在人工智能领域实现更多的技术创新突破,支持人工智能产业行稳致远;
二是把握我国经济结构优化调整,以实体经济、智能化需求为导向,深入挖掘制造、交通等领域,通过示范引领发挥并放大人工智能技术的效应,形成技术和产业的良性循环;
三是坚持改革探索,打造良好的产业发展生态。人工智能的迭代更新速度与传统行业有质的区别,必须深入分析制约人工智能发展的深层次制度要求,通过不断深化改革,破除束缚人工智能发展的体制机制障碍,在政策、机制、资金,模式创新积极探索实践,打好组合拳;
四是坚持开放合作,集聚智慧。人工智能发展要坚持更深程度、更广范围的合作,有效集聚全球创新资源,加强人工智能相关基础理论、关键技术研究,积极开展治理合作,与全球各国共同探索人工智能治理和监管模式,持续提升有关算法、规则、数据的使用,以及安全保障等治理能力。