阿C的博客

Author: 阿C (page 1 of 21)

网站安全检测入侵知识

  《小猪佩奇》提供了一种最让人认同的家庭生活。

  从情感上打开了我们发自内心的认同感。要知道情感的枢纽是最打动人心的环节。这个情感的维护在家庭,生活,工作中都是很好的纽带。而佩奇的一家做到了我们大部分做不到的!佩奇的一家有一个温和的妈妈、一个宽厚的爸爸,爸爸妈妈很相爱,爷爷奶奶相处很融洽。

  首先,佩奇和乔治有一个非常温和的妈妈。

  佩奇的妈妈,值得我们大多数妈妈学习。她从来不生气,永远和颜悦色,不慌不忙,就算不高兴也只是一小会儿,甚至从来不大声讲话。因为从来不生气,所以这种温和的批评反而更有力量。佩奇几乎都会马上认错,也会很快得到原谅。而这点需要我们认真去反思的,我们有时趋于一种病态的心理去教育孩子,出差几天或者很长一段时间看不到孩子,总想着回到家给孩子一个大大的微笑,和拥抱,甚至是爱惜的亲吻,但是,每每回到家,孩子的哭闹总会烦扰我们,孩子的无理的要求总会招来我们的横眉冷对,愁眉紧锁,甚至一顿肆虐人心的谩骂和一顿结结实实的强势暴打。(此处有指责声,我也是这样的妈妈)

  要知道,看了很多书,我才知道一个情绪平和的妈妈,是宝宝童年最大的幸运。

  其次是有个宽厚的爸爸,有担当,责任心富有爱心的爸爸,也是一件特幸运的事情。猪爸爸运动细胞强大,是跳泥坑的世界纪录保持者,长跑、游泳、跳水、滑冰样样精通。猪爸爸还擅长音乐,手风琴拉得有模有样,还会打架子鼓。也许,作为爸爸,还是要有让孩子崇拜的才能。”还好,家里的孩子爸爸,也会一点乐器演奏。

  然后是说父母相爱的力量。对于孩子来说,爸爸爱妈妈,会给他们最大的安全感。温和的猪妈妈不仅对宝宝们和颜悦色,对自己有点懒、爱犯傻、爱逞强的老公也从不批评指责,而总是用一种非常温柔的态度来对待他。这一点也是我以后渐渐改变的方向,我们需要在孩子的爸爸面前给予鼓励,给予支持和帮助,让他在外人面前有自尊,在孩子面前拥有更多的自信,在孩子妈妈面前是个可以遮风挡雨的人。

  也许,正如《幸福婚姻法则》幸福的婚姻有一个 “孩子定律”
  第一条:孩子永远是孩子,丈夫也是孩子。
  第二条:当你的丈夫引起你的不满时,请读一遍第一条。
  上面这两句话送给所有的妈妈共勉;

  当然幸福的婚姻还有一个 太太定律
  第一条:太太永远是对的。
  第二条:如果太太错了,请参照第一条执行。
  上面这两句话送给所有的爸爸共勉。

  电视中的猪爸爸和猪妈妈从来不避讳在孩子面前表达爱。有一次,猪妈妈被困蓝莓灌木丛,猪爸爸化身“王子”救出了“公主”猪妈妈,他们在孩子面前甜蜜的一吻。在孩子面前展现父母的相爱,恰恰是教给他们学习如何去爱的最好方式。这也是一种奠定孩子未来婚姻生活的幸福价值观、美好人生观的最好表达。(现如今,看到太多90后孩子因为父母不幸的婚姻,害怕婚姻这座“围城”)。

  让爷爷奶奶成为宝宝们的第二照顾者,有人说跟父母之间最理想的距离是“一碗汤的距离”,就是不要离得太远也不要太近。有界限、有距离、有联系、有守望,最佳的距离就是 “一碗汤的距离”。炖个鸡汤,端到孩子家时刚好能喝,近了太烫,远了太凉。那么这就是最适合的距离。也是如今或是日后最佳的养老方式。

  其他的因素:有兄弟姐妹的陪伴对孩子的成长很重要,佩奇的弟弟乔治,和佩奇的朋友一起玩耍,一起扮演佩奇和佩奇朋友(苏西)的病人,另外佩奇的童年生活里没有学习,佩奇在家中从来不学习,在幼儿园也只是学着 1-10 的数数,其次幼儿园教导就是画画、体育、乐器、演话剧,还会带孩子们去露营。学的是全面拓展孩子的兴趣和爱好等技能。充分让她在玩耍的年纪,好好玩耍,在跳泥坑中慢慢掌握人生的一些“大人的道理”,殊不知,猪爸爸的一句“要和泥坑融合一起”,未来,佩奇也是跳泥坑的世界冠军!

  最后,佩奇的一家物质简单。没有奢华的家具陈列,没有华而不实的昂贵摆设,没有所谓虚荣浮夸的豪车名宅。是的,佩奇一家向我们很好地诠释了,孩子的童年并不需要太多的物质满足。
也许,我们依然还是在多年之后,给不了孩子小猪佩奇那样的童年,至少我们能懂得:对孩子,需要父母适时放手;对爱人,陪伴是最长情的告白,无论何时,请不要吝啬表达自己的爱。

产品经理面试题目

  • 产品经理为什么总是在砍需求?
  • 工作三五年之后,你悟出了什么道理?
  • 把你的简历缩到10行
  • 介绍下自己后,再问:你的弱点是什么?你是如何改进的?
  • 你有理想吗?你有特长吗?你的兴趣爱好?
  • 你最近一个发现的好产品?糟糕产品?
  • 讲一个给你很大启发的产品功能?
  • 有什么事是你认为对,但大多数人反对的?
  • 在什么重要的产品问题上你与其他人有不同看法?
  • 做 PM 最无聊的地方是什么?
  • 说下对你的工作或职业发展产生影响最大的两个人,为什么他们对你的影响最大?
  • 为何你会想从事该行业或者想从事该产品相关的工作?
  • 介绍一个你认为设计得很牛的非互联网产品。
  • 讲讲你曾经与工程师或设计师意见不合的情况,你怎么处理的?
  • 最常用网络应用,最烂最好各是哪些,各自亮点和关键问题?
  • 什么是产品经理?为做产品经理做了什么准备?
  • 为什么喜欢做产品经理?
  • 你觉得产品经理需要具备什么样的素质和能力?
  • 什么是好产品?
  • 你觉得怎样的产品才是一个成功的产品?成功的产品有什么标准?
  • 如果时光倒流,回到一年前,你认为自己最应该改进的地方在哪里?
  • 是否可以介绍一下,过去一年里你与同事或上级的一次意见分歧。这个分歧最后是怎么解决的呢?
  • 你和老板有没有发生过意见不统一的情况?能否回忆下细节?最后是怎么解决的?
  • 最近半年有没有遇到特别感兴趣的新产品?
  • 最近一个月,你最关注的IT行业动态有哪些?
  • 离职原因?
  • 能不能举两三个例子,讲讲你常用的,提高产品工作效率的小技巧?
  • 过去一年里,你在工作中感受到最有成就感的一件事情是什么?
  • 过去一年里,你在工作中遭遇的最大的一次挫折是什么?你现在怎样看待这次挫折?
  • 过去一年里,你在工作中最累最辛苦的一次是什么情况?当时是怎么撑过去的?
  • 过去一年里,在工作中最令你烦恼的事情是什么?
  • 过去一年里,在工作中学到的最有价值的东西是什么?
  • 你怎样影响其他人接受你的看法?
  • 提供什么样的工作环境,你的工作会最成功?
  • 你在找工作时最看重什么?
  • 在决定聘用下属产品经理/项目经理职位时,你认为哪些因素是最重要的?
  • 在你所做过的事情中,最有创造性的是什么?
  • 工作中有过的最大的失望是什么?你的反应如何?
  • 你负责过的产品,用户体验和商业收益之间的最大冲突是什么?怎么处理的?
  • 你的团队中,有一个人很难沟通,但你必须和他合作,你怎么办?
  • 说一段最值得一提的产品设计经历。当时原始需求、设计思路、最终效果分别怎样?如果重新来设计,还有哪些改进的空间?
  • 如何获取和发现用户需求?
  • 产品经理的职责是什么?
  • 如何判定各个产品需求的优先级?
  • 有什么弱点或优点使你在产品经理职业能取得更大成就?
  • 看什么书,玩什么游戏,总结一下感受?
  • 专业以外学到什么?
  • 能不能举两三个例子,讲讲令你印象深刻的,特别有创意的产品交互设计?
  • 能不能举两三个例子,讲讲你特别欣赏的,证明自己工作态度特别好的细节?
  • 请分别介绍一下你常用的输入法、IM、杀毒软件、下载软件、影音软件、图像浏览与处理软件、浏览器、邮件系统、博客/空间/社交网站。
  • 和别人比,你有不同吗?你比别人更适合做这份工作的优势是什么?
  • 你认为自己最显著的成就是什么?
  • 你觉得有什么优势让你在这个职位上比别人取得更大成就?你对哪个成就最满意?
  • 你最大的长处和弱点分别是什么?这些长处和弱点对你在企业的业绩会有什么样的影响?
  • 有没有设计过贴心的功能,得到良好的用户口碑?
  • 最失败的一段经历?为什么?
  • 用户反馈说糟糕(例如,现在朋友圈垃圾信息太多),你能想到几种解决办法,其中最好的是什么?
  • 平常喜欢研究哪种类型的产品?如果让你来设计,有没有新的尝试?
  • 你最喜欢的一款app,谈一下它的亮点与缺点。你会如何改进?
  • 生活中有没有发现还没有被满足的需求,你会怎样来满足该需求?
  • 选择这份工作,最看重的地方。
  • 分别说一下自己最大的优点和缺点。
  • 有没有体验过硬件?以一款硬件为例,说一下你的认识。
  • 对最近火热的90后创业有怎样的看法?
  • 你做的最成功的事情(不是产品)是什么?如果再做一次,怎样能做的更好?
  • 你觉得产品策划和产品运营有什么区别和联系?
  • 平时都会使用一些应用和网站?觉得有哪些点设计的比较好?
  • 最近一年最想做的产品是什么,为什么想做,打算怎么做?

  • 你认为滴滴或xx是如何取得成功的?
  • 对滴滴出行经验、评价?更喜欢和不满哪个产品?
  • 如果可以自由选择产品,你想选择为滴滴的哪一款产品工作?
  • 你判断坐专车的用户是月薪多少的?
  • 定点定时不等候,小巴能接受,快车用户能接受吗?

需求分析和洞察
(1)以前做的项目里,哪个用户需求是你发现的?怎么发现的?阐述一下这个需求发生的场景。
产品方案设计
(1)以前的产品里面你觉得做的最成功的一个功能模块是什么?怎么做的?为什么要这样做?
数据假设与分析
(1)当时做那款产品(或那个功能)的时候,你最想验证的是什么需求?你认为什么指标最能够反映这项需求?最后的数据情况怎么样?
(2)我们现在有一个版本是做收藏功能,你觉得上线后应该测量哪些数据?怎么设计数据收集方式比较合理?


Continue reading

本文主题-规避反爬虫 什么是反爬虫?参看 # 反爬虫(Anti-spider) #

今天穿插一个话题,教大家怎么规避反爬虫。一般来说我们会遇到网站反爬虫策略主要有下面几点:

  1. 限制IP访问频率,超过频率就断开连接。
  2. 限制UA访问频率,超过频率就断开连接。[介绍]
  3. 限制Session访问频率,超过频率就断开连接。
  4. 限制Cookies访问频率,超过频率就断开连接。
附加说明:
针对IP: 爬虫解决办法是,降低爬虫的速度在每个请求前面加上 sleep() 或者不停的更换代理IP。
针对UA: 爬虫解决办法是,准备大量UserAgent随机调用。

我们今天就来针对1、2两点来写出反爬虫的下载模块,别害怕真的很简单。

使用模块
  • requests(网络请求模块)
  • re(正则表达式模块)
  • random(随机选择模块)
实现思路
  1. 代理IP发布网站中获取有效IP地址;
  2. 本地IP访问网页;当本地IP失效时,转换使用代理IP访问网页;
  3. 代理IP失败六次后转换下一个代理IP。

下面我们开整ヽ(●-`Д´-)ノ


第一步、先看看Python的默认UA
import requests

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.post("http://httpbin.org/post", data=payload)
print r.text

运行结果:

{
  "args": {},
  "data": "",
  "files": {},
  "form": {
    "key1": "value1",
    "key2": "value2"
  },
  "headers": {
    "Accept": "*/*",
    "Accept-Encoding": "gzip, deflate",
    "Connection": "close",
    "Content-Length": "23",
    "Content-Type": "application/x-www-form-urlencoded",
    "Host": "httpbin.org",
    "User-Agent": "python-requests/2.13.0"
  },
  "json": null,
  "origin": "220.200.59.163",
  "url": "http://httpbin.org/post"
}

我们可以看到,程序请求页面的UA是这样的: python-requests/2.13.0,而正常浏览器请求页面的UA应该是这样的:Mozilla/5.0 (Windows NT 6.1; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0

规避反爬虫-正常UA

反爬虫程序若做上述检测,则当场被抓现形,直接枪毙。

所以呢,我们必须要伪造正常浏览器访问的UA,同时为了一次性解决 2.限制UA访问频率 ,我们还需要伪造大量的UA,请求时随机选取一个,混淆视听。

Continue reading

KJ法 (极其猥琐的方法) 是日本川喜田二郎提出的一种质量管理工具。这一方法是从错综复杂的现象中,用一定的方式来整理思路、抓住思想实质、找出解决问题新途径的方法。KJ法不同于统计方法。统计方法强调一切用数据说话,而KJ法则主要用事实说话,靠“灵感”发现新思想、解决新问题

KJ法又称A型图解法亲和图法(Affinity Diagram),是新的QC七大手法之一。KJ法是将未知的问题、未曾接触过领域的问题的相关事实、意见或设想之类的语言文字资料收集起来,并利用其内在的相互关系作成归类合并图,以便从复杂的现象中整理出思路,抓住实质,找出解决问题的途径的一种方法。

实施步骤

  1. 准备: 主持人和与会者4~7人。准备好黑板、粉笔、卡片、大张白纸、文具。
  2. 头脑风暴法会议: 主持人请与会者提出30-50条设想,将设想依次写到黑板上。
  3. 制做卡片: 主持人同与会者商量,将提出的设想概括2-3行的短句,写到卡片上。每人写一套。这些卡片称为“基础卡片”
  4. 分成小组: 让与会者按自己的思路各自进行卡片分组,把内容在某点上相同的卡片归在一起,并加一个适当的标题,用绿色笔写在一张卡片上,称为“小组标题卡”。不能归类的卡片,每张自成一组。
  5. 并成中组: 将每个人所写的小组标题卡和自成一组的卡片都放在一起。经与会者共同讨论,将内容相似的小组卡片归在一起,再给一个适当标题,用黄色笔写在一张卡片上,称为“中组标题卡”。不能归类的自成一组。
  6. 归成大组: 经讨论再把中组标题卡和自成一组的卡片中内容相似的归纳成大组,加一个适当的标题,用红色笔写在一张卡片上,称为“大组标题卡”
  7. 编排卡片: 将所有分门别类的卡片,以其隶属关系,按适当的空间位置贴到事先准备好的大纸上,并用线条把彼此有联系的连结起来。如编排后发现不了有何联系,可以重新分组和排列,直到找到联系。
  8. 确定方案: 将卡片分类后,就能分别地暗示出解决问题的方案或显示出最佳设想。经会上讨论或会后专家评判确定方案或最佳设想。

应用流程

  1. 组织团队: 将问题可能涉及的相关部门人员组织起来,少则可以是3-5人,多则数十人。意见特别强烈的人不能被摒除在外,平时不讲话的人,只要工作相关便需邀请参加。
  2. 建立共识: 运用团队技巧,让团体成员降低压力,建立整体共存共荣的一体感,避开针对个人与部门的攻击,减轻防卫性的心理状态。研讨会不要在公司里,封闭式效果更好,座位的安排不要依照组织位阶,围成圆圈马蹄型较佳。
  3. 定义挑战: 清楚提出挑战,并指出期望的结果。例如∶公司已经投入3亿开发高新科技项目,至今尚无成果,我们的目标是找出问题的关键,并决定是否继续投入资金,如果要继续投入,未来该如何控制本项目,并如何确保成果。
  4. 展开脑力激荡: 人数如果在12人以下,可以集体操作,如果在12人以上,最好分成几个小组,每组约4-8人,将同部门的人,分散在不同的小组,以便能互相交流。此阶段主要将所有问题现象详细列出,并将问题写在N次贴的贴纸上,每张贴纸只写一个问题,时间约为30-90分钟。如果问题太多,可以延长时间,但中间需要休息。
  5. 汇集问题: 脑力激荡结束,集合各小组成员,由各小组轮流上台发表脑力激荡结果,并将N次贴一一贴在事先准备好的大海报纸上,如果有相同点,便将该问题贴在一起,当全部发表完后,所有可能的问题已经全部呈现在大家眼前。一般问题会在数十个左右,特别复杂的情况可能多达几百个。
  6. 分类整理: 此时由主持人引导大家将问题分成几个大类,分类完成后,经过检查一遍,便形成几大类的问题了。
  7. 排出顺序: 将每一大类的问题,根据其严重性排列顺序,如果问题甚多,可以分成A、B、C三组,A组是最重要的,B组是一般重要,C组是次要的。
  8. 责任划分: 将各类问题牵涉的部门,以矩阵图的方式列出,并标示出主要负责部门与参与解决部门。
  9. 构思方案: 由主要负责部门带头,举办小型研讨会,并提出建议方案,经由决策小组同意后,形成决策,同时交付执行。
  10. 效果确认与跟进: 根据执行计划,定期与不定期的检讨成果与进度,并做适当的调整与修正,直到问题解决完毕。
  11. 标准化: 如果此问题将来还会遇到,必需将此次的经验,变成标准化的流程,并将相关的资料形成书面化,以利未来的参考,不仅能节省时间与成本,更能促成组织的学习能力,这也是未来组织的重要核心能力-知识管理的能力。如果公司有内联网,应该将此信息公布于网上,以便将此经验转化为全公司的技能。

什么是爬虫和反爬虫?

  • 爬虫:使用技术手段,批量获取网站信息。关键在于批量。
  • 反爬虫:使用技术手段,阻止别人批量获取自己的网站信息。关键也在于批量。
  • 误伤:在反爬虫的过程中,错误的将普通用户识别为爬虫。误伤率高的反爬虫策略,效果再好也不能用。
  • 拦截:成功地阻止爬虫访问。这里会有拦截率的概念。通常来说,拦截率越高的反爬虫策略,误伤的可能性就越高。因此需要做个权衡。
  • 成本:机器成本与人力成本的总和。

注意:人力成本也是资源,而且比机器更重要。因为,根据摩尔定律,机器越来越便宜。而根据IT行业的发展趋势,程序员工资越来越贵。因此,让对方加班才是王道,机器成本并不是特别值钱。

传统反爬虫手段

  • 封IP:后台对访问进行统计,如果单个IP访问超过阈值,予以封锁。
    这个虽然效果还不错,但是其实有两个缺陷,一个是非常容易误伤普通用户,另一个就是,IP其实不值钱,几十块钱甚至有可能买到几十万个IP。所以总体来说是比较亏的。不过针对三月份呢爬虫,这点还是非常有用的。
  • 封session:后台对访问进行统计,如果单个session访问超过阈值,予以封锁。
    session即账号。这个看起来更高级了一些,但是其实效果更差,因为session完全不值钱,重新申请一个就可以了。
  • 封UA:后台对访问进行统计,如果单个UserAgent访问超过阈值,予以封锁。
    这个是大招,类似于抗生素之类的,效果出奇的好,但是杀伤力过大,误伤非常严重,使用的时候要非常小心。至今为止我们也就只短暂封杀过mac下的火狐。(因为爬虫通常使用火狐的UserAgent居多)

注意:组合起来能力变大,误伤率下降,在遇到低级爬虫的时候,还是比较好用的。

纯JAVASCRIPT反爬虫示例

  • 更改连接地址:让对方抓取到错误数据。这种方法简单,但是如果对方针对性的来查看,十分容易被发现。
  • 静态更改密钥:手工操作,做法简单,不易被发现。key即是密钥,通过有意爬取错误数据的方式来迷惑,实际数据已经下来用计算拿到。
  • 动态更改密钥:程序操作,做法简单,不易被发现,代价更低。将静态更改密钥的代码变为0
  • 复合更改密钥:让对方很难分析,如果加了浏览器检测,更难被爬取。

我抓到你了——该怎么办

  • 不会引发生产事件 —— 直接拦截
  • 可能引发生产事件 —— 给假数据(投毒)

注意:一旦发现,技术压制心理战放水……

一些想法

  • 越是低级的爬虫,越容易被封锁,但是性能好,成本低。越是高级的爬虫,越难被封锁,但是性能低,成本也越高。
  • 当成本高到一定程度,我们就可以无需再对爬虫进行封锁。因为考虑边际效应,应该寻找黄金点,该放则放,超过这个点,那就让它爬好了。毕竟我们反爬虫不是为了面子,而是为了商业因素。

更多内容参看: 关于反爬虫,看这一篇就够了 & 缓存图
关注一下技术:PhantomJS & Selenium

《异类》一书告诉我们,天才不是天生的,而是练出来的。

「练」,并非随意的练习,是刻意的练习(deliberate practice)。在体育、音乐等领域,刻意练习帮助人们快速成长为「天才」

同样,软件设计和代码设计的能力也需要刻意的练习。不可否认,大家在工作的实际项目中能够不停地得到提升,并且还能够得到前辈的指导。但事实上,这样的提升还不够快,因为:

1
项目交付压力大
项目交付的压力让你不能有太多的思考,更多时候是条件反射。
2
不能重复
无法重复,不可能花时间在相同的需求上,这对公司没有价值。
3
没时间回顾
很少有时间让你回顾,手头的需求还没有完成,下一波已经在面前了。
4
缺乏对比和交流
缺乏对比和交流,无法知道好坏,一般公司不会有资源同时让多组不同的人做相同的需求,最后最优选择。

所 · 以


我们就要……


刻意练习

朋友们如有兴趣,可以试验一下这个题目: ThoughtWorks面试题:收银机 & 缓存图

有人说“忙”既是心死,争分夺秒地往前赶时,你需要停下来内观自我、等一等灵魂。在这些简约的空间内,不是勤奋争取得到,而是断舍离,整理思绪、深度思考,静下来,有时比勤奋还重要。

深度思考决定人生。思考到什么样的程度才算得上是深度思考呢?有四个方面:1.多维思考;2.具象思考;3.思考原因;4.思考后果。

传送门:如何进行深度思考? & 缓存图

今天跟技术兄弟们长谈两个半小时,聊了很多。关于技术部的改变,团队的制度,加班的调整,可能上市的情况……
然后回来就跟阿凡、龚叔继续通宵代码到现在。两个兄弟一直奋战至现在,我期间分心写了个爬虫搞了整个妹子图,幼稚!
现在我们三个都累了,准备出去一起吃个早点,各自回家,下午再来。来的时候就是面对我们嬖雯、小花美眉,测试大全新后台开始。

Olderposts

Copyright © 2020 阿C的博客

Theme by AC.AsiaUp ↑