逻辑回归的常见面试题总结

1.简介 逻辑回归是面试当中非常喜欢问到的一个机器学习算法,因为表面上看逻辑回归形式上很简单,很好掌握,但是一问起来就容易懵逼。所以在面试的时候给大家的第一个建议不要说自己精通逻辑回归,非常容易被问倒,从而减分。下面总结了一些平常我在作为面试官面试别人和被别人面试的时候,经常遇到的一些问题。 ...

2023-03-16 19:35 · 9 min · 4309 words · Reid

机器学习面试题

1. 无监督和有监督的区别? 有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。 ...

2023-03-16 19:35 · 17 min · 8157 words · Reid

最常考的正则问题L1L2

正则化也是校招中常考的题目之一,在去年的校招中,被问到了多次: 1、过拟合的解决方式有哪些,l1和l2正则化都有哪些不同,各自有什么优缺点(爱奇艺) 2、L1和L2正则化来避免过拟合是大家都知道的事情,而且我们都知道L1正则化可以得到稀疏解,L2正则化可以得到平滑解,这是为什么呢? 3、L1和L2有什么区别,从数学角度解释L2为什么能提升模型的泛化能力。(美团) 4、L1和L2的区别,以及各自的使用场景(头条) ...

2023-03-16 19:35 · 1 min · 230 words · Reid

最常考的树模型问题

问题目录: 1、决策树的实现、ID3、C4.5、CART(贝壳) 2、CART回归树是怎么实现的?(贝壳) 3、CART分类树和ID3以及C4.5有什么区别(贝壳) 4、剪枝有哪几种方式(贝壳) 5、树集成模型有哪几种实现方式?(贝壳)boosting和bagging的区别是什么?(知乎、阿里) 6、随机森林的随机体现在哪些方面(贝壳、阿里) 7、AdaBoost是如何改变样本权重,GBDT分类树的基模型是?(贝壳) 8、gbdt,xgboost,lgbm的区别(百度、滴滴、阿里,头条) 9、bagging为什么能减小方差?(知乎) ...

2023-03-16 19:35 · 8 min · 3820 words · Reid

MySql高频面试问题

本文主要受众为开发人员,所以不涉及到MySQL的服务部署等操作,且内容较多,大家准备好耐心和瓜子矿泉水。 前一阵系统的学习了一下MySQL,也有一些实际操作经验,偶然看到一篇和MySQL相关的面试文章,发现其中的一些问题自己也回答不好,虽然知识点大部分都知道,但是无法将知识串联起来。 ...

2023-03-16 19:35 · 20 min · 9777 words · Reid

MySql索引优化

数据库表结构: 1 2 3 4 5 6 7 8 9 create table user ( id int primary key, name varchar(20), sex varchar(5), index(name) )engine=innodb; select id,name where name='shenjian' select id,name,sex where name='shenjian' 多查询了一个属性,为何检索过程完全不同? 什么是回表查询? ...

2023-03-16 19:35 · 4 min · 1678 words · Reid

ES面试题

ElasticSearch面试题 1.为什么要使用Elasticsearch? 因为在我们商城中的数据,将来会非常多,所以采用以往的模糊查询,模糊查询前置配置,会放弃索引,导致商品查询是全表扫面,在百万级别的数据库中,效率非常低下,而我们使用ES做一个全文索引,我们将经常查询的商品的某些字段,比如说商品名,描述、价格还有id这些字段我们放入我们索引库里,可以提高查询速度。 ...

2023-03-16 19:35 · 16 min · 7614 words · Reid

Spark 面试注意点

基础篇 sparksql 如何加载metadata 任何的SQL引擎都是需要加载元数据的,不然,连执行计划都生成不了。 加载元数据总的来说分为两步: 加载元数据 创建会话连接Hive MetaStore 首先,Spark检测到我们没有设置spark.sql.warehouse.dir,然后就开始找我们在hite-site.xml中配置的hive.metastore.warehouse.dir。 ...

2023-03-16 19:34 · 17 min · 8158 words · Reid