ಡೇಟಾವನ್ನು Google ಹೇಗೆ ಅನಾಮಧೇಯಗೊಳಿಸುತ್ತದೆ
ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ ಎನ್ನುವುದು ಡೇಟಾ ಪ್ರಕ್ರಿಯಗೊಳಿಸುವಿಕೆ ಕೌಶಲ್ಯವಾಗಿದ್ದು ಅದು ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ ಅಥವಾ ಮಾರ್ಪಡಿಸುತ್ತದೆ; ಇದು ಅನಾಮಧೇಯಗೊಳಿಸಿದ ಡೇಟಾಗೆ ಕಾರಣವಾಗುತ್ತದೆ ಮತ್ತು ಅದನ್ನು ಯಾವ ವ್ಯಕ್ತಿಯ ಜೊತೆಗೂ ಸಂಯೋಜಿಸಲಾಗುವುದಿಲ್ಲ. ಇದು ಗೌಪ್ಯತೆಗೆ Google ನ ಬದ್ಧತೆಯ ಅತೀ ಪ್ರಮುಖವಾದ ಅಂಶವಾಗಿದೆ.
ಅನಾಮಧೇಯಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಕ, ಬಳಕೆದಾರರ ಗುರುತುಗಳನ್ನು ರಕ್ಷಿಸುವ ಜೊತೆಗೆ ನಮೂದಿಸಿದ ಶೋಧ ಪ್ರಶ್ನಾವಳಿಯ ಸ್ವಯಂಪೂರ್ಣಗೊಳಿಸುವಿಕೆ ಮತ್ತು ಫಿಶಿಂಗ್ ಹಾಗೂ ಮಾಲ್ವೇರ್ ಸೈಟ್ಗಳಂತಹ ಭದ್ರತೆ ಅಪಾಯಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಪತ್ತೆಹಚ್ಚುವಂತಹ ಸುರಕ್ಷಿತವಾದ ಮತ್ತು ಮೌಲ್ಯಯುತ ಉತ್ಪನ್ನಗಳು ಮತ್ತು ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನಿರ್ಮಿಸಲು ಸಾಧ್ಯವಾಗಿದೆ. ನಾವು ಅನಾಧಮೇಯಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ಸಹ ಸುರಕ್ಷಿತವಾಗಿ ಬಾಹ್ಯವಾಗಿ ಹಂಚಿಕೊಳ್ಳಬಹುದು ಮತ್ತು ಈ ಮೂಲಕ ನಮ್ಮ ಬಳಕೆದಾರರ ಗೌಪ್ಯತೆಯನ್ನು ಅಪಾಯಕ್ಕೆ ಒಡ್ಡದೆಯೇ ಇತರರಿಗೆ ಅದನ್ನು ಉಪಯುಕ್ತವಾಗಿಸಬಹುದು.
ನಿಮ್ಮ ಡೇಟಾ ರಕ್ಷಿಸಲು ನಾವು ಬಳಸುವ ಎರಡು ಕೌಶಲ್ಯಗಳು
ಡೇಟಾ ಸಾಮಾನ್ಯೀಕರಿಸುವುದು
ಕೆಲವು ಡೇಟಾ ಅಂಶಗಳಿದ್ದು ಅವುಗಳನ್ನು ಕೆಲವು ವ್ಯಕ್ತಿಗಳಿಗೆ ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಸಂಪರ್ಕಪಡಿಸಬಹುದಾಗಿರುತ್ತದೆ. ಆ ವ್ಯಕ್ತಿಗಳನ್ನು ರಕ್ಷಿಸುವುದಕ್ಕಾಗಿ, ಡೇಟಾದ ಕೆಲವು ಭಾಗವನ್ನು ತೆಗೆದುಹಾಕಲು ಅಥವಾ ಅದರ ಕೆಲವು ಭಾಗವನ್ನು ಸಾಮಾನ್ಯ ಮೌಲ್ಯದೊಂದಿಗೆ ಬದಲಾಯಿಸಲು ನಾವು ಸಾಮಾನ್ಯೀಕರಣವನ್ನು ಬಳಸುತ್ತೇವೆ. ಉದಾಹರಣೆಗೆ, ಎಲ್ಲಾ ಪ್ರದೇಶ ಕೋಡ್ಗಳು ಅಥವಾ ಫೋನ್ ಸಂಖ್ಯೆಗಳ ವಿಭಾಗಗಳನ್ನು ಅದೇ ಅನುಕ್ರಮದ ಸಂಖ್ಯೆಗಳ ಜೊತೆಗೆ ಬದಲಾಯಿಸಲು ಸಾಮಾನ್ಯೀಕರಣವನ್ನು ನಾವು ಬಳಸಬಹುದು.
ಸಾಮಾನ್ಯೀಕರಣವು ನಮಗೆ ಒಂದೇ ತೆರನಾದ ವ್ಯಕ್ತಿಗಳಿರುವ ಗುಂಪಿನಲ್ಲಿ ವ್ಯಕ್ತಿಗಳ ಗುರುತನ್ನು ಮರೆ ಮಾಡುವುದಕ್ಕಾಗಿನ ಕೌಶಲ್ಯವನ್ನು ವಿವರಿಸಲು ಬಳಸಲಾಗುವ ಉದ್ಯಮ-ಪ್ರಮಾಣಿತ ಪದವಾಗಿರುವ ಕೆ-ಅನಾನಿಮಿಟಿಯನ್ನು ಸಾಧಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ. ಕೆ-ಅನಾನಿಮಿಟಿ ಎಂಬುದರಲ್ಲಿ ಕೆ ಎನ್ನುವುದು ಗುಂಪಿನ ಗಾತ್ರವನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಸಂಖ್ಯೆಯಾಗಿದೆ. ಹೊಂದಿಸಲಾಗಿರುವ ಡೇಟಾದಲ್ಲಿ ಯಾವುದೇ ವ್ಯಕ್ತಿಗೆ, ಒಂದೇ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಹೊಂದಿರುವ ಕನಿಷ್ಠ ಕೆ-1 ವ್ಯಕ್ತಿಗಳಿದ್ದರೆ, ಡೇಟಾ ಸೆಟ್ಗಾಗಿ ಕೆ-ಅನಾನಿಮಿಟಿಯನ್ನು ನಾವು ಸಾಧಿಸಿದ್ದೇವೆ ಎಂದು ಅರ್ಥ. ಉದಾಹರಣೆಗೆ, ಕೆ ಎನ್ನುವುದು 50 ಕ್ಕೆ ಸಮಾನವಾಗಿರುವ ಮತ್ತು ಗುಣಲಕ್ಷಣವು ಜಿಪ್ ಕೋಡ್ ಆಗಿರುವ ಕೆಲವು ಡೇಟಾ ಸೆಟ್ ಅನ್ನು ಊಹಿಸಿಕೊಳ್ಳಿ. ಆ ಡೇಟಾ ಸೆಟ್ನಲ್ಲಿರುವ ಯಾವುದೇ ವ್ಯಕ್ತಿಯನ್ನು ನಾವು ಗಮನಿಸಿದರೆ, ಒಂದೇ ಜಿಪ್ ಕೋಡ್ ಹೊಂದಿರುವ ಇತರೆ 49 ವ್ಯಕ್ತಿಗಳನ್ನು ನಾವು ಸದಾ ಕಾಣಬಹುದು. ಆದ್ದರಿಂದ, ಕೇವಲ ಅಪ್ ಜಿಪ್ ಕೋಡ್ ಮೂಲಕ ಯಾವುದೇ ಒಂದು ವ್ಯಕ್ತಿಯನ್ನು ಗುರುತಿಸಲು ನಮಗೆ ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ.
ಡೇಟಾ ಸೆಟ್ನಲ್ಲಿರುವ ಎಲ್ಲಾ ವ್ಯಕ್ತಿಗಳು ಒಂದೇ ಮೌಲ್ಯದ ಸೂಕ್ಷ್ಮ ಆಟ್ರಿಬ್ಯೂಟ್ ಅನ್ನು ಹಂಚಿಕೊಂಡರೆ, ಈ ವ್ಯಕ್ತಿಗಳು ಪ್ರಶ್ನಾರ್ಹವಾಗಿರುವ ಡೇಟಾ ಸೆಟ್ನ ಭಾಗವಾಗಿದ್ದಾರೆ ಎಂಬುದನ್ನು ತಿಳಿದುಕೊಳ್ಳುವ ಮೂಲಕ ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸಬಹುದು. ಈ ಅಪಾಯವನ್ನು ತಗ್ಗಿಸಲು, ನಾವು ಸೂಕ್ಷ್ಮ ಮೌಲ್ಯಗಳಲ್ಲಿನ ವೈವಿಧ್ಯತೆಯ ಸ್ವಲ್ಪ ಮಟ್ಟವನ್ನು ವಿವರಿಸಲು ಉದ್ಯಮ-ಪ್ರಮಾಣಿತ ಪದವಾದ ಐ-ಡೈವರ್ಸಿಟಿ ಪ್ರಯೋಜನವನ್ನು ನಾವು ಪಡೆದುಕೊಳ್ಳಬಹುದು. ಉದಾಹರಣೆಗೆ, ಕೆಲವು ಸೂಕ್ಷ್ಮ ಆರೋಗ್ಯ ವಿಷಯಕ್ಕೆ (ಉದಾ. ಫ್ಲೂ ರೋಗಲಕ್ಷಣಗಳು) ಎಲ್ಲರೂ ಒಂದೇ ಸಮಯಕ್ಕೆ ಹುಡುಕಿರುವ ಜನರ ಗುಂಪಿನ ಕುರಿತು ಯೋಚಿಸಿ. ಒಂದು ವೇಳೆ ನಾವು ಈ ಡೇಟಾ ಸೆಟ್ ನೋಡಿದರೆ, ಕೆ-ಅನಾನಿಮಿಟಿ ಸಹಾಯದಿಂದ ವಿಷಯಕ್ಕೆ ಯಾರು ಹುಡುಕಿದ್ದಾರೆ ಎಂಬುದನ್ನು ತಿಳಿಸಲು ನಮಗೆ ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ. ಆದರೆ, ಪ್ರತಿಯೊಬ್ಬರೂ ಸೂಕ್ಷ ಆಟ್ರಿಬ್ಯೂಟ್ (ಅಂದರೆ, ಪ್ರಶ್ನಾವಳಿಯ ವಿಷಯ) ಹಂಚಿಕೊಳ್ಳುವುದರಿಂದ ಗೌಪ್ಯತೆ ಕಳವಳಗಳಿರಬಹುದು. ಎಲ್-ಡೈವರ್ಸಿಟಿ ಎಂದರೆ ಹೊಂದಿಸಲಾದ ಅನಾಮಧೇಯಗೊಳಿಸಿದ ಡೇಟಾ ಫ್ಲೂ ಹುಡುಕಾಟಗಳನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಿರುವುದಿಲ್ಲ. ಬದಲಿಗೆ, ಅದು ಬಳಕೆದಾರ ಗೌಪ್ಯತೆಯನ್ನು ಹೆಚ್ಚಿನದಾಗಿ ರಕ್ಷಿಸುವುದಕ್ಕಾಗಿ ಫ್ಲೂ ಹುಡುಕಾಟಗಳ ಜೊತೆಗೆ ಇತರೆ ಹುಡುಕಾಟಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ.
ಡೇಟಾಗೆ ನಾಯ್ಸ್ ಸೇರಿಸುವಿಕೆ
ವ್ಯತ್ಯಾಸದ ಗೌಪ್ಯತೆಯು (ಹಾಗೆಯೇ ಉದ್ಯಮ-ಪ್ರಮಾಣಿತ ಪದ) ಡೇಟಾಗೆ ಗಣಿತದ ನಾಯ್ಸ್ ಸೇರಿಸುವುದಕ್ಕಾಗಿನ ಕೌಶಲ್ಯವನ್ನು ವಿವರಿಸುತ್ತದೆ. ವ್ಯತ್ಯಾಸದ ಗೌಪ್ಯತೆಯ ಮೂಲಕ, ಯಾವುದೇ ಒಂದು ವ್ಯಕ್ತಿಯ ಡೇಟಾ ಸೆಟ್ನ ಭಾಗವಾಗಿದ್ದಾರೆಯೇ ಎಂದು ನಿರ್ಣಯಿಸುವುದು ಕಷ್ಟಕರ, ಏಕೆಂದರೆ ಯಾವುದೇ ಒಬ್ಬ ವ್ಯಕ್ತಿಯ ಮಾಹಿತಿಯನ್ನು ಸೇರಿಸಿಕೊಂಡಿದ್ದರೂ ಅಥವಾ ಬಿಟ್ಟಿದ್ದರೂ ಸಹ ನೀಡಿರುವ ಅಲ್ಗಾರಿದಮ್ನ ಔಟ್ಪುಟ್ ಒಂದೇ ಆಗಿ ಕಂಡುಬರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಭೌಗೋಳಿಕ ಪ್ರಾಂತ್ಯದಾದ್ಯಂತ ಫ್ಲೂಗಾಗಿ ಹುಡುಕಾಟಗಳಲ್ಲಿ ಒಟ್ಟಾರೆ ಟ್ರೆಂಡ್ ಅನ್ನು ನಾವು ಮಾಪನ ಮಾಡುತ್ತಿದ್ದೇವೆ ಎಂಬುದಾಗಿ ಊಹಿಸಿ. ವ್ಯತ್ಯಾಸದ ಗೌಪ್ಯತೆಯನ್ನು ಸಾಧಿಸಲು, ಡೇಟಾ ಸೆಟ್ಗೆ ನಾವು ನಾಯ್ಸ್ ಸೇರಿಸುತ್ತೇವೆ. ನೀಡಿರುವ ನೆರೆಹೊರೆಯಲ್ಲಿ ಫ್ಲೂ ಗಾಗಿ ಹುಡುಕುತ್ತಿರುವ ಜನರ ಸಂಖ್ಯೆಯನ್ನು ನಾವು ಸೇರಿಸಬಹುದು ಅಥವಾ ಕಳೆಯಬಹುದು, ಆದರೆ ಹಾಗೆ ಮಾಡುವುದರಿಂದ ವ್ಯಾಪಕ ಪ್ರಾಂತ್ಯದಾದ್ಯಂತ ಟ್ರೆಂಡ್ನ ನಮ್ಮ ಮಾಪನಕ್ಕೆ ಪರಿಣಾಮ ಬೀರುವುದಿಲ್ಲ. ಡೇಟಾ ಸೆಟ್ಗೆ ನಾಯ್ಸ್ ಸೇರಿಸುವುದರಿಂದ ಅದು ಕಡಿಮೆ ಉಪಯುಕ್ತವಾಗುವುದಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು.
ಅನಾಮಧೇಯತೆ ಎನ್ನುವುದು ಬಳಕೆದಾರ ಗೌಪ್ಯತೆಗೆ ನಮ್ಮ ಬದ್ಧತೆಯನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳಲು ನಾವು ಬಳಸುವ ಒಂದು ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ. ಇತರೆ ಪ್ರಕ್ರಿಯೆಗಳು ಬಳಕೆದಾರ ಡೇಟಾ ಪ್ರವೇಶದ ಕುರಿತಂತೆ ಕಟ್ಟುನಿಟ್ಟಿನ ನಿಯಂತ್ರಣಗಳು, ಡೇಟಾ ಸೆಟ್ಗಳಿಗೆ ಸೇರಿಸಿಕೊಳ್ಳುವುದನ್ನು ನಿಯಂತ್ರಿಸಲು ಮತ್ತು ಮಿತಿಗೊಳಿಸುವುದಕ್ಕಾಗಿ ನೀತಿಗಳು ಮತ್ತು ಅನಾಮಧೇಯತೆಯ ಕೇಂದ್ರೀಕೃತ ಪರಿಶೀಲನೆ ಮತ್ತು Google ನಾದ್ಯಂತ ಸ್ಥಿರ ಮಟ್ಟದ ರಕ್ಷಣೆಯನ್ನು ಖಾತ್ರಿಪಡಿಸಿಕೊಳ್ಳಲು ಡೇಟಾ ನಿಯಂತ್ರಣ ಕಾರ್ಯನೀತಿಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ.