Korean Society For Cognitive and Biological Psychology
[ Article ]
The Korean Journal of Cognitve & Biological Psychology - Vol. 30, No. 2, pp.97-112
ISSN: 1226-9654 (Print)
Print publication date 30 Apr 2018
Received 25 Jan 2018 Revised 20 Apr 2018 Accepted 20 Apr 2018
DOI: https://doi.org/10.22172/cogbio.2018.30.2.002

평균 크기 지각에 대한 계산 모형

백종수1) ; 정상철2), 3),
연세대학교 글로벌융합기술원
연세대학교 심리학과
연세대학교 인지과학협동과정
A computational model of mean size perception
Jongsoo Baek1) ; Sang Chul Chong2), 3),
Yonsei Institute of Convergence Technology, Yonsei University
Department of Psychology, Yonsei University
Graduate Program in Cognitive Science, Yonsei University

Correspondence to: 정상철, 연세대학교 심리학과 및 인지과학협동과정, (03722) 서울특별시 서대문구 연세로 50 E-mail: scchong@yonsei.ac.kr

초록

인간의 시각 체계는 처리 용량의 한계를 극복하기 위해 복잡한 시각 자극의 중복되는 정보들을 요약해서 표상한다. 요약된 표상의 한 가지 예는 다양한 시각 자극의 평균 크기를 표상하는 것인데, 많은 선행 연구들을 통해 시각 체계의 평균 표상 능력은 매우 정확하다고 알려져 있다. 본 연구에서는 이와 같은 평균 크기 표상의 기제를 설명하는 계산 모형을 제안한다. 제시된 모형에서 시각 체계는 개별 자극들을 다소간의 잡음(초기 잡음)과 함께 부호화하고, 여러 자극들에서 부호화된 정보들을 통합한다. 시각 체계는 정보가 통합된 이후에도 의식 수준의 최종적인 표상이 형성되기 전까지 일정 수준의 잡음이 추가적으로 더해진다(후기 잡음). 본 모형의 타당도를 검증하기 위해 여러 크기의 자극들을 포함한 기준 자극 화면과 비교 자극 화면의 평균 크기를 비교하는 정신물리학 실험을 실시했다. 실험 결과, 크기 차이 변별의 민감도를 나타내는 역치는 자극 개수에 따라 감소했다. 다시 말해, 실험 참가자들은 자극 개수가 많아짐에 따라 그 자극들의 평균 크기를 더 정확하게 지각했는데, 이 결과는 후기 잡음을 포함한 모형으로 잘 설명된다. 본 모형은 개별 시각 정보들이 어떤 과정을 거쳐서 평균 표상을 형성하게 되는지를 보여주며, 본 연구에 사용된 실험 패러다임은 다양한 시각 속성의 평균 표상을 연구하는 데에 유용한 도구가 될 것으로 기대된다.

Abstract

Human visual system represents a statistical summary of a complex visual input to overcome its limited capacity. An example of summary representation is the average size perception, which has been known to be accurate and precise. In the current study, we developed and validated a computational model of mean size perception. In this model, we assumed that the visual system encodes individual sizes with early noise, then integrates the noisy size information from multiple inputs. Finally, the integrated size information is added by late noise. The suggested model was validated with a psychophysical experiment, in which the standard and the test displays included multiple circles with different sizes and observers were asked to report which display had larger mean size. The psychophysical data was well accounted by the model with late noise: threshold for mean size discrimination was decreased with set-size, but the decrement of threshold was decelerated in large set-sizes. The proposed model allows us to understand underlying mechanism of mean size perception, and the experimental paradigm used in the current study is expected to be a useful tool for studying ensemble perception of various visual properties.

Keywords:

mean size perception, computational model, noisy percept, early noise, late noise, central limit theorem, signal detection theory

키워드:

평균 표상, 지각, 계산모형, 초기 소음, 후기 소음, 중심극한정리, 신호처리이론

Acknowledgments

이 논문은 과학기술정보통신부 및 정보통신기술진흥센터의 ICT명품인재양성사업(IITP-2018-2017-0-01015)과 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임 (NRF-2016R1A2B4016171).

References

  • Allik, J., Toom, M., Raidvee, A., Averin, K., & Kreegipuu, K. (2013). An almost general theory of mean size perception. Vision Research, 83, 25-39. [https://doi.org/10.1016/j.visres.2013.02.018]
  • Alvarez, G. A. (2011). Representing multiple objects as an ensemble enhances visual cognition. Trends in Cognitive Sciences, 15(3), 122-31. [https://doi.org/10.1016/j.tics.2011.01.003]
  • Ariely, D. (2001). Seeing Sets: Representation by Statistical Properties. Psychological Science, 12(2), 157-162. [https://doi.org/10.1111/1467-9280.00327]
  • Bauer, B. (2009). The danger of trial-by-trial knowledge of results in perceptual averaging studies. Attention, Perception & Psychophysics, 71(3), 655-65. [https://doi.org/10.3758/APP.71.3.655]
  • Brainard, D. H. (1997). The Psychophysics Toolbox. Spatial Vision, 10(4), 433-436. [https://doi.org/10.1163/156856897X00357]
  • Burgess, A. E., Wagner, R. F., Jennings, R. J., & Barlow, H. B. (1981). Efficiency of human visual signal discrimination. Science, 214(4516), 93-4. [https://doi.org/10.1126/science.7280685]
  • Chong, S. C., & Treisman, A. (2003). Representation of statistical properties. Vision Research, 43(4), 393-404. [https://doi.org/10.1016/S0042-6989(02)00596-5]
  • Chong, S. C., & Treisman, A. (2005a). Attentional spread in the statistical processing of visual displays. Perception & Psychophysics, 67(1), 1-13. [https://doi.org/10.3758/BF03195009]
  • Chong, S. C., & Treisman, A. (2005b). Statistical processing: computing the average size in perceptual groups. Vision Research, 45(7), 891-900. [https://doi.org/10.1016/j.visres.2004.10.004]
  • Chong, S. C., Joo, S. J., Emmanouil, T.-A., & Treisman, A. (2008). Statistical processing: not so implausible after all. Perception & Psychophysics, 70(7), 1327-34. [https://doi.org/10.3758/PP.70.7.1327]
  • Dakin, S. C., &Watt, R. J. (1997). The computation of orientation statistics from visual texture. Vision Research, 37(22), 3181-3192. [https://doi.org/10.1016/S0042-6989(97)00133-8]
  • Eckstein, M. P., Ahumada, A. J., & Watson, A. B. (1997). Visual signal detection in structured backgrounds. II. Effects of contrast gain control, background variations, and white noise. Journal of the Optical Society of America. A, Optics, Image Science, and Vision, 14(9), 2406-19. [https://doi.org/10.1364/JOSAA.14.002406]
  • Foley, J. M., & Legge, G. E. (1981). Contrast detection and near-threshold discrimination in human vision. Vision Research, 21(7), 1041-53. [https://doi.org/10.1016/0042-6989(81)90009-2]
  • Fouriezos, G., Rubenfeld, S., & Capstick, G. (2008). Visual statistical decisions. Perception & Psychophysics, 70(3), 456-464. [https://doi.org/10.3758/PP.70.3.456]
  • Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. New York: Wiley.
  • Haberman, J., &Whitney, D. (2007). Rapid extraction of mean emotion and gender from sets of faces. Current Biology : CB, 17(17), R751-3. [https://doi.org/10.1016/j.cub.2007.06.039]
  • Haberman, J., & Whitney, D. (2010). The visual system discounts emotional deviants when extracting average expression. Attention, Perception & Psychophysics, 72(7), 1825-38. [https://doi.org/10.3758/APP.72.7.1825]
  • Haberman, J., & Whitney, D. (2009). Seeing the mean: ensemble coding for sets of faces. Journal of Experimental Psychology: Human Perception and Performance, 35(3), 718-34. [https://doi.org/10.1037/a0013899]
  • Heeley, D. W., & Buchanan-Smith, H. M. (1996). Mechanisms specialized for the perception of image geometry. Vision Research, 36(22), 3607-27. [https://doi.org/10.1016/0042-6989(96)00077-6]
  • Klein, S. A. (2001). Measuring, estimating, and understanding the psychometric function: a commentary. Perception and Psychophysics, 63, 1421-1455. [https://doi.org/10.3758/BF03194552]
  • Lee, H., Baek, J., & Chong, S. C. (2016). Perceived magnitude of visual displays: Area, numerosity, and mean size. Journal of Vision, 16(3), 12. [https://doi.org/10.1167/16.3.12]
  • Leib, A. Y., Kosovicheva, A., & Whitney, D. (2016). Fast ensemble representations for abstract visual impressions. Nature Communications, 7, 13186. [https://doi.org/10.1038/ncomms13186]
  • Lesmes, L. A., Lu, Z.-L., Baek, J., Tran, N., Dosher, B. A., & Albright, T. D. (2015). Developing Bayesian adaptive methods for estimating sensitivity thresholds (d’) in Yes-No and forced-choice tasks. Frontiers in Psychology, 6, 1070. [https://doi.org/10.3389/fpsyg.2015.01070]
  • Levitt, H. (1971). Transformed up-down methods in psychoacoustics. The Journal of the Acoustical Society of America, 49(2), 467-477. [https://doi.org/10.1121/1.1912375]
  • Lu, Z.-L., & Dosher, B. A. (1998). External noise distinguishes attention mechanisms. Vision Research, 38(9), 1183-98. [https://doi.org/10.1016/S0042-6989(97)00273-3]
  • Lu, Z.-L., & Dosher, B. A. (1999). Characterizing human perceptual inefficiencies with equivalent internal noise. Journal of the Optical Society of America A, 16(3), 764. [https://doi.org/10.1364/JOSAA.16.000764]
  • Lu, Z.-L., & Dosher, B. A. (2008). Characterizing observers using external noise and observer models: assessing internal representations with external noise. Psychological Review, 115(1), 44-82. [https://doi.org/10.1037/0033-295X.115.1.44]
  • Lu, Z.-L., & Dosher, B. A. (2013). Visual Psychophysics: From Laboratory to Theory. Cambridge: The MIT Press. [https://doi.org/10.7551/mitpress/9780262019453.001.0001]
  • Macmillan, N. A., & Creelman, C. D. (1991). Detection Theory: A User’s Guide. New York: Cambridge Univesity Press.
  • Maule, J., Witzel, C., & Franklin, A. (2014). Getting the gist of multiple hues: metric and categorical effects on ensemble perception of hue. Journal of the Optical Society of America. A, Optics, Image Science, and Vision, 31(4),A93-102. [https://doi.org/10.1364/JOSAA.31.000A93]
  • Morgan, M. J., Ward, R. M., & Hole, G. J. (1990). Evidence for positional coding in hyperacuity. Journal of the Optical Society of America. A, Optics and Image Science, 7(2), 297-304. [https://doi.org/10.1364/JOSAA.7.000297]
  • Nachmias, J. (1981). On the psychometric function for contrast detection. Vision Research, 21(2), 215-23. [https://doi.org/10.1016/0042-6989(81)90115-2]
  • Nachmias, J., & Sansbury, R. V. (1974). Grating contrast: discrimination may be better than detection. Vision Research, 14(10), 1039-42. [https://doi.org/10.1016/0042-6989(74)90175-8]
  • Parkes, L., Lund, J., Angelucci, a, Solomon, J. A., & Morgan, M. J. (2001). Compulsory averaging of crowded orientation signals in human vision. Nature Neuroscience, 4(7), 739-44. [https://doi.org/10.1038/89532]
  • Pelli, D. G. (1985). Uncertainty explains many aspects of visual contrast detection and discrimination. Journal of the Optical Society of America. A, Optics and Image Science, 2(9), 1508-32. [https://doi.org/10.1364/JOSAA.2.001508]
  • Pelli, D. G., & Zhang, L. (1991). Accurate control of contrast on microcomputer displays. Vision Research, 31(7-8), 1337-50. [https://doi.org/10.1016/0042-6989(91)90055-A]
  • Robitaille, N., & Harris, I. M. (2011). When more is less: extraction of summary statistics benefits from larger sets. Journal of Vision, 11(12), 1-8. [https://doi.org/10.1167/11.12.18]
  • Sweeny, T. D., & Whitney, D. (2014). Perceiving crowd attention: ensemble perception of a crowd’s gaze. Psychological Science, 25(10), 1903-13. [https://doi.org/10.1177/0956797614544510]
  • Teghtsoonian, M. (1965). The Judgment of Size. The American Journal of Psychology, 78(3), 392. [https://doi.org/10.2307/1420573]
  • Wannacott, T. H., & Wonnacott, R. J. (1981). Regression a second course in statistics. New York: Wiley.
  • Watamaniuk, S. N., & Duchon, A. (1992). The human visual system averages speed information. Vision Research, 32(5), 931-41. [https://doi.org/10.1016/0042-6989(92)90036-I]
  • Williams, D. W., & Sekuler, R. (1984). Coherent global motion percepts from stochastic local motions. Vision Research, 24(1), 55-62. [https://doi.org/10.1016/0042-6989(84)90144-5]
  • Yeshurun, Y., Carrasco, M., & Maloney, L. T. (2008). Bias and sensitivity in two-interval forced choice procedures: tests of the difference model. Vision Research, 48, 1837-1851. [https://doi.org/10.1016/j.visres.2008.05.008]

Appendix

부 록

평균 크기 표상에 대한 분석 모형

초기 잡음. 시각 체계상의 내적 잡음들은 특정 변량을 가지고 있는 무선 변수이기 때문에, 어떤 자극에 대한 내적 반응은 매번 달라질 수 있다. 따라서, 이 단계에서 내적 반응 x는 정규분포를 따르는 무선 변수 g(x,μ,σ1)로 기술될 수 있다.

정보 통합. 중심극한정리에 의해, n개의 자극에 대한 평균 크기 표상은 n이 증가함에 따라 표준편차가 줄어드는 정규분포상의 무선 변수가 된다. 내적 표상의 표준편차는 자극 개수 n의 제곱근의 역함수가 된다. σ1을 개별 자극들에 대한 초기 잡음의 표준편차라고 하면, n개의 자극들의 평균 크기 표상의 표준편차는 공식 1과 같이 정리된다.

σ=σ1n공식 A1 

후기 잡음. σ2를 후기 잡음의 표준편차라고 할 때, 후기 잡음을 포함한 내적 평균 표상의 표준편차는 다음과 같이 정리될 수 있다.

σ=σ12n+σ22공식 A2 

의사 결정. 신호탐지이론은 시각 체계가 표준 자극 세트와 비교 자극 세트 대한 내적 표상의 정규분포, g(xsss)와 g(xttt)를 만든다고 가정한다. 시각민감도를 나타내는 d’은 신호대잡음비로 정의된다.

d'=μt-μsσt2+σs22공식 A3 

이 때, 두 자극 세트가 동일한 개수의 자극을 포함하고 있으면, 즉 σ=σst이면, 공식 A3은 다음과 같이 단순화될 수 있다.

d'=μdiffσ공식 A4 

여기서 μdiff는 두 자극 세트 간의 물리적 평균 크기 차이, 즉, μdiffts이다. 공식 A2와 공식 A4를 통해, d’은 아래와 같이 재정리될 수 있다.

d'=μdiffσ12n+σ22공식 A5 

모형 예측. 신호탐지이론에서 관찰자가 비교 자극 세트가 기준 자극 세트에 비해서 그 평균 크기가 더 크다고 반응할 비율 pc는 민감도와 응답 편향에 의해서 결정되어진다. 응답 편향이 매우 작다고 알려진 2지 강제 선택 과제(2AFC)에서 응답자의 반응 비율 pc는 아래의 공식으로 계산될 수 있다.

pc=Φ(d'2)=Φ(μdiffσ2)공식 A6 

여기서 Φ(x)는 표준누적정규분포곡선을 나타낸다. 특정한 반응 비율 pct (예를 들면, 71%, 76%, 79% 혹은 84%)에 해당하는 역치는 아래의 공식으로도 계산되어질 수 있다.

θpct=G-1(pct,0,σ2)공식 A7 

여기서 G-1은 평균이 0이고 표준편차가 σ2 인 역 누적정규분포함수를 의미한다.