docs/zh_cn/administration/metadata/postgresql_best_practices.md
对于数据与元数据分离存储的分布式文件系统,元数据的读写性能直接影响整个系统的工作效率,元数据的安全也直接关系着整个系统的数据安全。
在生产环境中,建议您优先选择云计算平台提供的托管型云数据库,并搭配恰当的高可用性架构。
不论自行搭建,还是采用云数据库,使用 JuiceFS 应该始终关注元数据的完整和安全。
默认情况下,JuiceFS 客户端会采用 SSL 加密协议连接 PostgreSQL,如果数据库未启用 SSL 加密,则需要在元数据 URL 中需要附加 sslmode=disable 参数。
建议配置并始终开启数据库服务端 SSL 加密。
虽然直接在元数据 URL 中设置数据库密码简单方便,但日志或程序输出中可能会泄漏密码,为了保证数据安全,应该始终通过环境变量传递数据库密码。
环境变量名称可以自由定义,例如:
export $PG_PASSWD=mypassword
在元数据 URL 中通过环境变量传递数据库密码:
juicefs mount -d "postgres://user:[email protected]:5432/juicefs" /mnt/jfs
PostgreSQL 后端采用多进程模式,每一个连接对应后端一个进程,控制数据库的连接总数和减少数据库连接的动态创建都是非常必要的。JuiceFS 提供 4 个数据库连接相关的控制选项:
可在元数据 URL 中直接传递上述控制选项:
juicefs mount -d "postgres://user:[email protected]:5432/juicefs?max_open_conns=30&max_life_time=3600" /mnt/jfs
请参考 Go 模块文档 Database/SQL 了解更多信息。
请参考官方手册 Chapter 26. Backup and Restore 了解如何备份和恢复数据库。
建议制定数据库备份计划,并遵照计划定期备份 PostgreSQL 数据库,与此同时,还应该在实验环境中尝试恢复数据,确认备份是有效的。
连接池是客户端与数据库之间的中间层,由它作为中介提升连接效率,降低短连接的损耗。常用的连接池有 PgBouncer 和 Pgpool-II 。
PostgreSQL 官方文档 High Availability, Load Balancing, and Replication 对比了几种常用的数据库高可用方案,请根据实际业务需要选择恰当的高可用方案。
:::note 注意 JuiceFS 使用事务保证元数据操作的原子性。由于 PostgreSQL 尚不支持 Multi-Shard (Distributed) 分布式事务,因此请勿将多服务器分布式架构用于 JuiceFS 元数据存储。 :::