Tab Tu – Page 23

深入理解神经网络[Numpy](转)

by tabtu January 8, 20190 comments

使用诸如Keras、TensorFlow或PyTorch等高级框架，我们可以快速构建非常复杂的模型。这次我们将尝试利用我们的知识，只使用NumPy构建一个完全可操作的神经网络。最后，我们还将使用它来解决简单的分类问题，并将其与用Keras构建的机器学习模型进行性能比较。导入库 import numpy as np from IPython.display import Image 网络架构 Figure 1. Example of dense neural network architec 在开始编程之前，让我们先停下来准备一个基本的路线图。我们的目标是创建一个程序，能够创建一个具有指定架构(层的数量和大小以及适当的激活函数)的紧密连接的神经网络。图1给出了这样一个网络的例子。最重要的是，我们必须能够训练我们的网络并利用它进行预测。图2.神经网络蓝图上图显示了在我们的神经网络训练过程中需要执行的操作。它还显示了在单个迭代的不同阶段，我们需要更新和读取多少参数。构建正确的数据结构并巧妙地管理其状态是我们任务中最困难的部分。神经网络层的初始化图3.第1层的权重矩阵W和偏置向量 b的尺寸让我们从每一层的权重矩阵W和偏差向量b开始。在图3中，我已经准备了小的cheatsheet，这将帮助我们为这些系数标记适当的尺寸。上标[l]表示当前层的索引(从1开始计数)，我假设描述NN架构的信息将以列表的形式传递给我们的程序。列表中的每个条目是一个字典描述一个网络层的基本参数:input_dim- 信号矢量的大小作为层的输入，output_dim- 在层输出时得到的激活向量的大小，activation- 在层内使用的激活函数。 NN_ARCHITECTURE = [ {“input_dim”: 2, “output_dim”: 25, “activation”: “relu”}, {“input_dim”: 25, “output_dim”: 50, “activation”: “relu”}, {“input_dim”: 50, “output_dim”: 50, “activation”: “relu”}, {“input_dim”: 50, “output_dim”: 25, “activation”: …

Read more “深入理解神经网络[Numpy](转)”

20 个有用的 Go 语言微服务开发框架

by tabtu January 8, 20190 comments

2007 年，谷歌的一个团队在调研计算机编程语言时，发现有数百种可用于开发软件的语言，但没有一种能提供谷歌真正需要的特性。有些语言太过底层，有些又太过复杂，有些特性对他们来说反而会碍手碍脚。谷歌的开发人员想要的语言要简单到可以在几个小时内学会，但又要复杂到足以应付现代互联网的信息流。他们的解决方案就是 Go 语言，这门语言对于 C 语言、Java 或 JavaScript 程序员来说——换句话说，就是所有的程序员——都很容易掌握。Go 语言提供了足够的特性来编写循环和代码块，但没有一个特性是需要很长的时间才能掌握的。内置的例程经过优化，可以从互联网获取数据和发送数据。其他的东西——即使是非常聪明的想法——都被排除在外。 Go 语言是微服务开发团队的一个很好的选择。即使你的项目可能不需要像谷歌那样向全世界提供电子邮件、地图、搜索和其他云服务，但仍然可能需要向用户提供数十种不同的小型信息服务。谷歌决定开源 Go 语言是一个明智之举。这门语言培育了数千个开源项目，这些项目为你的 Web 项目提供了开箱即用的构建块。这里列出了 20 个最有趣的开源项目，用于构建基于 Go 语言的微服务系统。从专注于消息传递、路由、错误处理或 API 的小工具包，到用于构建 MVC Web 应用程序的更全面的框架，你将发现，使用 Go 语言开发微服务有着非常丰富的选择。 Beego https://beego.me/ Beego 框架提供了很多标准附加功能，例如全功能路由器和可用于执行 CRUD 操作的对象到数据库映射工具。Bee 是 Beego 爱好者的最爱，它是一个快速而强大的命令行工具，用于构建、更新、打包和部署应用程序。Bee 可以从模板生成源代码，并保持数据库的最新状态。 Buffalo https://gobuffalo.io/en Buffalo 团队需要能够将 Web 应用程序的所有部分组装在一起的东西，包括应用程序本身的一些设计。他们把能够安装在一起的很多部件叫作“生态系统”。如果你想要路由——很少有人不需要——Buffalo 就包含了 Gorilla/Mux。如果你需要模板，Buffalo 倾向于使用 Plush，而不是使用内置的 Go 语言模板机制。数据库连接模块集合 Pop 可以帮你将数据库信息转换为 Go 对象。你还可以找到连接数据库、处理 …

Read more “20 个有用的 Go 语言微服务开发框架”

Facebook开源NLP建模框架PyText

by tabtu January 8, 20190 comments

项目地址：https://github.com/facebookresearch/pytext 为了降低人们创建、部署自然语言处理系统的难度，Facebook 开源了一个建模框架——PyText，它模糊了实验与大规模部署之间的界限。这一框架基于 PyTorch，可以为 NLP 的发展带来以下好处：提供简化的工作流程，加速实验。提供一大批预构建的模型架构和用于文本处理和词汇管理的工具，以促进大规模部署。提供利用 PyTorch 生态系统的能力，包括由 NLP 社区中的研究人员、工程师预构建的模型和工具。 AI 研究人员和工程师现在可以利用 PyText 加快实验进度，部署用于文档分类、序列标注、语义分析、多任务建模及其他任务的系统。利用该框架，Facebook 在几天内就实现了 NLP 模型从理念到完整实施的整个过程，还部署了依赖多任务学习的复杂模型。现在，PyText 被 Facebook 用于超过十亿次的日常预测工作，这表明该框架可以以产品级的规模运行，能够满足严格的延迟要求。在优化框架时，神经网络工程师一直都在实验和生产之间进行权衡，NLP 系统的工程师更是如此。NLP 系统需要创建、训练、测试数十个模型，其结构具有动态特性。以研究为导向的框架可以提供一个简单的 eager-execution 接口，加快创建动态高级模型的进程，但如果将它们部署到生产，就会面临延迟多、内存占用多的困境。针对生产进行优化的框架可以通过将模型展示为静态图来加快部署，但这种方法增加了创建文本序列动态表征的难度。PyTorch 1.0 是一个统一的框架，缩短了从研究到生产的路径。而基于 PyTorch 的 PyText 则着眼于满足 NLP 建模的特定需求。此次一起开源的还有一些用于大规模训练和部署 PyText 模型的预训练模型及教程。走向更好的 NLP AI 研究人员及工程师拥有许多可以理解语言的系统应用，而且这些应用还在增加。Facebook 利用 NLP 向用户提供相关性更强的内容，为他们提供更加强大的可用功能、标记违规动态、翻译等其它服务。会话 AI 的前沿研究进展迅速，PyText 可以进一步加快这一进程，同时提高产品质量。PyText 目前已经部署到 Facebook 的视频通话设备 Portal 以及 Messenger …

Read more “Facebook开源NLP建模框架PyText”

ls高级用法

by tabtu January 8, 20190 comments

假如我们有这样的一个文件夹，我们用tree命令查看它的目录结构：用法1：列出/home/alvin/test_dir目录下所有文件及目录的详细资料命令： ls -lR /home/alvin/test_dir/ 结果： [alvin@VM_0_16_centos test_dir]$ ls -lR /home/alvin/test_dir/ /home/alvin/test_dir/: total 28 -rw-rw-r– 1 alvin alvin 37 Nov 18 09:12 atb_aux.c -rw-rw-r– 1 alvin alvin 8 Nov 18 09:12 atb_can.c -rw-rw-r– 1 alvin alvin 24 Nov 18 09:12 atb_orch.c -rw-rw-r– 1 alvin alvin 5 Nov 18 09:12 atb_ota.c drwxrwxr-x 2 alvin alvin …

find命令详细解释

by tabtu January 8, 20190 comments

Linux系统中的 find 命令在查找文件时非常有用而且方便。它可以根据不同的条件来查找文件，例如权限、拥有者、修改日期/时间、文件大小等等。在这篇文章中，我们将学习如何使用 find 命令以及它所提供的选项来查找文件。在绝大多数Linux发行版中，你都可以直接使用 find 命令而无需进行任何安装操作。如果你想在linux系统的命令行中变得特别高效，那么 find 是你必须掌握的命令之一。 find 命令的基本语法如下： $ find [path] [option] [expression] 一、基本用法 1. 列出当前目录和子目录下的所有文件这个命令会列出当前目录以及子目录下的所有文件。 $ find . ./abc.txt ./subdir ./subdir/how.php ./cool.php 该命令与以下命令效果相同 $ find . $ find . -print 2. 查找特殊的目录或路径下面的命令会查找当前目录下 test 文件夹中的文件，默认列出所有文件。 $ find ./test ./test ./test/abc.txt ./test/subdir ./test/subdir/how.php ./test/cool.php 下面的命令用于查找指定名称的文件。 $ find ./test -name “abc.txt” …

几个基本的Python算法

by tabtu January 8, 2019January 8, 20190 comments

台阶问题/斐波纳挈一只青蛙一次可以跳上1级台阶，也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。斐波那契解释：斐波那契数列（Fibonacci sequence），又称黄金分割数列、因数学家列昂纳多·斐波那契（Leonardoda Fibonacci）以兔子繁殖为例子而引入，故又称为“兔子数列”。指的是这样一个数列 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233，377，610，987，1597，2584，4181，6765，10946，17711，28657，46368……..这个数列从第3项开始，每一项都等于前两项之和。如果设F(n）为该数列的第n项（n∈N*），那么这句话可以写成如下形式：:F(n)=F(n-1)+F(n-2)。显然这是一个线性递推数列。二分查找快排广度遍历和深度遍历二叉树给定一个数组，构建二叉树，并且按层次打印这个二叉树单链表逆置

Python爬去智联招聘,BI可视化

by tabtu January 8, 20190 comments

数据分析的过程如同烧一顿饭，先要数据采集（买菜），然后数据建模（配菜）、数据清洗（洗菜）、数据分析（做菜）、数据可视化（摆盘上菜）。所以第一步，要采集/选择数据。一、Python爬取智联招聘岗位信息（附源码）选择智联招聘，通过Python来进行“BI工程师”的关键数据信息的爬取，这里大家也可以试着爬取自己岗位的关键词，如“数据分析师”、“java开发工程师 ”等。经过F12分析调试，数据是以JSON的形式存储的，可以通过智联招聘提供的接口调用返回。那么我这边通过Python对智联招聘网站的数据进行解析，爬取了30页数据，并且将岗位名称、公司名称、薪水、所在城市、所属行业、学历要求、工作年限这些关键信息用CSV文件保存下来。附上完整Python源码： import requests import json import csv from urllib.parse import urlencode import time def saveHtml(file_name,file_content): #保存conten对象为html文件 with open(file_name.replace(‘/’,’_’)+’.html’,’wb’) as f: f.write(file_content) def GetData(url,writer):#解析并将数据保存为CSV文件 response= requests.get(url) data=response.content saveHtml(‘zlzp’,data) #保存html文件 jsondata=json.loads(data) dataList=jsondata[‘data’][‘results’] #print(jsondata) for dic in dataList: jobName=dic[‘jobName’] #岗位名称 company=dic[‘company’][‘name’] #公司名称 salary=dic[‘salary’] #薪水 city=dic[‘city’][‘display’] #城市 jobtype = dic[‘jobType’][‘display’] #所属行业 eduLevel=dic[‘eduLevel’][‘name’] #学历要求 …

Read more “Python爬去智联招聘,BI可视化”