0%


任务2:Movielens介绍

  • 下载并读取Movielens 1M数据集(用户、电影、评分)
  • 统计如下指标:
    • 总共包含多少用户?
    • 总共包含多个电影?
    • 平均每个用户对多少个电影进行了评分?
    • 每部电影 & 每个用户的平均评分是?
  • 如果你来进行划分数据集为训练和验证,你会如何划分?

代码地址: https://github.com/Guadzilla/Basics-of-Recsys

阅读全文 »


任务1:推荐系统基础

代码地址: https://github.com/Guadzilla/Basics-of-Recsys

阅读全文 »

image-20220405151429046

什么是数据卷

数据不应该放在容器中,如果容器删除,数据就会丢失!==需求:数据 持久化==

MYSQL,容器删了=删库跑路!==需求:MYSQL数据可以存储在本地==

==> 需要容器之间有一个数据共享的技术!Docker容器中产生的数据,同步到本地!

这就是卷技术!说白了就是目录的挂载,将容器内的目录,挂载到 Linux 上

image-20220405151429046

总结:容器的持久化和同步操作! 容器间也可以数据共享!

使用数据卷

方式一:直接使用命令来挂载 -V

阅读全文 »

image-20220404192342184

镜像

镜像:一种轻量级、可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件,包含运行某个软件所需的所有内容,包括代码、库、环境变量和配置文件。

每个文件叠加过后就是我们的应用,虽然是叠加而来,但是对外却是一个整体的系统文件

镜像加载原理

UFS文件系统

下载时看到一层层的就是这个。

联合文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。联合文件系统是 Docker 镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。另外,不同 Docker 容器就可以共享一些基础的文件系统层,同时再加上自己独有的改动层,大大提高了存储的效率。

特性:一次性同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。

Docker镜像加载原理

阅读全文 »

帮助命令

1
2
3
docker version		# 显示docker 的版本信息
docker info # 显示docker 的系统信息,包括镜像和容器的数量
docker 命令 --help # 帮助命令

帮助文档的地址:参考文档|Docker 文档

镜像命令

docker images 查看所有本地的主机上的镜像

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
xxx@data:~/solrdata$ sudo docker images 
REPOSITORY TAG IMAGE ID CREATED SIZE
solr 8 ce1fcccc6f5e 5 days ago 563MB
solr latest ce1fcccc6f5e 5 days ago 563MB

# 解释
REPOSITORY 镜像的仓库源
TAG 镜像的标签
IMAGE ID 镜像的id
CREATE 镜像的创建时间
SIZE 镜像的大小

# 可选项
Options:
-a, --all # 列出所有镜像
-q, --quiet # 只显示镜像的id

xxx@data:~/solrdata$ sudo docker images -aq
ce1fcccc6f5e
ce1fcccc6f5e
阅读全文 »