EzDoum

찾기
처음으로 | 찾기 | 아카이브 | 글 올리기 | 링크 | 자료실 | 통계 | 연락처 | 자유게시판
이지도움 특집
전체보기
네트워크
TI OMAP35x
TI DaVinci
Analog Blackfin
RobotWar2005
임베디드!
캐쉬의 모든것
메모리 할당 알고리즘
CPU 파이프라이닝
자료구조(Tree)
금융

Login
이름

암호

기억하기


사용자 등록

현재 접속중인 등록 사용자는 0명, 익명 사용자는 5명 입니다.
전체 등록 사용자: 751명

마지막 답장
·libcurl + fuse 조합으로 되는게 많네. (1)
·Linux Ftrace에 관해 (3)
·Android MTP ( Media Transfer Protocol ) (1)
·Lighttpd에 인증을 digest 사용시 IE 오동작 문제? (1)
·Dtrace에 관해 (1)

최근글
·OpenSSL and multi-threads (0)
·ARM 환경에서 OpenCL 사용 (0)
·IoT용 WIFI 모듈 비교 ( MCU ) 클래스 (0)
·Glances - 리눅스 여러 가지 항목을 한 화면에서 모니터링 (0)
·plugin 방식의 로그 분석기 (0)

뜨거운 감자
·나는 인터렉티브한 환경에서 역어셈블 한다. (12)
·GNU REGEX (정규표현식) 프로그래밍 강좌 (7)
·SoCRobotWar 2005 - 신입생 기초 교육자료 (7)
·ASP.NET의 데이터 그리드와 사용자 컨트롤 (7)
·DHTML Editing Control (7)

가장 많이 읽은 글
·[Cache] 2-way Set-Associative 방식이란 무엇일까? (2)
·멀티쓰레드(Pthread) 프로그래밍
·GNU REGEX (정규표현식) 프로그래밍 강좌 (7)
·Sorting Algorithm Animation (2)
·SoCRobotWar 2005 - 신입생 기초 교육자료 (7)

non-cache to non-cache memcpy
글쓴이: EzDoum 글쓴날: 2011년 02월 05일 오후 02:27
하드웨어



non-cache to non-cache memcpy를 하니 캐쉬의 도움을 전혀 받지 못해서 생각보다 cpu를 많이 소모했다.
( 시스템 병목 지점이 ddr이라 더 심하게 영향을 받음 )

뭐 dma를 쓰면 되지 안겠느냐고 말하겠지만 지금 사용하는 아키텍쳐는 dma를 사용하기엔 좀 오버헤드가 있다.
( 큰 덩어리의 블럭을 copy하는게 아니라, 인코딩된 프레임된 데이터라 20k미만의 불연속적인 버퍼라
dma를 사용해서 얻는 이득보다, 설정하고 기다리는 커널 서비스 호출 오버헤드가 큼 )

그래서 dcache 힘이라도 좀 받아 볼려구 아래와 같이 stack 버퍼를 거쳐서 가게했더니
non-cache to stack(cache 4k block) to non-cache
개선이 좀 됐다. (글작성을 위해 따로 프로파일링 결과 정리는 생략 ..)

이런 관점에서 구글링을 좀 해보니 건질만한게 있으나 non-cache에다가 memcpy는 그닥 없다.

음 한 두가지 더 시도해서 개선 효과를 볼만한게,
ddr 컨트롤러가 다루는 burst단위로 조작하는 것과 prefetch 지시자를 넣어 보는것 정도인데,
연휴 끝나고 시도해봐야겠다.


ARM memcpy and memmove
http://cygwin.ru/ml/libc-ports/2006-10/msg00024.html

Faster StrNCpy
http://www.mail-archive.com/pgsql-hackers@postgresql.org/msg83125.html

Performance of various memcpy()'s
http://mail-index.netbsd.org/tech-perform/2002/10/23/0004.html

Huge pages part 5: A deeper look at TLBs and costs
http://lwn.net/Articles/379748/

Optimizing Memcpy improves speed
http://www.eetimes.com/design/embedded/4024961/Optimizing-Memcpy-improves-speed

ARM - memcpy 최적화
http://blog.naver.com/nhlsm/100054918069

DMA vs ARM9 - fight!
http://www.coranac.com/2009/05/dma-vs-arm9-fight


[분류: 하드웨어 인쇄용 페이지 본문 email로 보내기 ]

<  illustrated glossary of common vector graphics terms | Contiguous memory allocation  >

답장 쓰기
글을 올리시려면 로그인 (사용자 등록) 하셔야 합니다.

검색
Google

분류
·공지 (6)
·인터넷 (87)
·하드웨어 (260)
·C/C++ (65)
·어셈블리 (7)
·리눅스 (136)
·리눅스 커널 (67)
·윈도우즈 (25)
·데이터베이스 (20)
·보안 (16)
·.NET (25)
·그래픽 (13)
·책소개 (42)
·호기심 천국 (80)
·잡담 (111)
·사랑 (3)

전체 본문수: 963
전체 답장수: 525


분류 : 하드웨어
최근글
최근글
가장 많이 읽은 글
·[Cache] 2-way Set-Associative 방식이란 무엇일까? (2)
뜨거운 감자
·SoCRobotWar 2005 - 신입생 기초 교육자료 (7)

EzDoum투표
이지도움 어때요?
이게 뭐야. 다시 안올란다. --;
아이 좋아라~ +_+;
관심없다.
먼가는 있는거 같은데 뭐하는 곳이지?
기타 (자유게시판에 글로 남겨 주세요)
[ 결과 | 투표 ]

랜덤 링크
http://kldp.net


 Home ^ BACK TO TOP ^ EzDoum - 도움이 필요하세요~??
 Powered by KorWeblog 1.5.8 Copyleft © 2001 EzDoum, 관리자: EzDoum